或許是校園內,光天化日之下不便說出一些私密的事情。
好像有一雙眼睛在看他們。那雙眼睛融進了深淵,看不清輪廓,卻能感受到目光。
冷汗沒緣由地滲出脊背。
甄巧不由分說拉住他。
「走,迴家說。」
**
沒有冬天會比這個二月寒冷。
當他們談起這個話題時,身邊的溫度驟降,暖氣也成了萬裏寒冰。
整件事情實在過於複雜。
於是像之前幾次那樣,甄巧拿出一遝a4紙和不同顏色的記號筆,和莫向晚坐在沙發上思考。
若要從一堆混亂的線索中找出彼此的聯繫,必須要全部整理並直觀地寫下來,才有分析的餘地。
將莫向晚前幾次死亡日的行程列下來,唯一的交點隻有一個——去dhl寄郵件。
絕對有問題。
「你到底在研究什麽?」
「一些無關緊要的。」
「那請你告訴我。」
「我不能說。」
……
在甄巧再三逼問後,莫向晚終於打算說實話了。他舒展開修長的腿,後背靠在沙發上,仰頭看向天花板。
「母語可以決定人的思維方式,你知道吧。」
「嗯。」
「語言反應了人的意識。」
「嗯。」
這些都是甄巧在以前的時間線上,和莫向晚探討過的問題。曾經的她覺得語言學一無是處,現在的她對語言學心悅誠服。
「任何人發一段文字,通過特定的手段分析,都能從中推斷出一些信息。或是作者的性別,性格;或是作者的母語,寫作習慣,平日常讀什麽書。」
甄巧點點頭:「語言偵探。」
她曾親眼見證過,莫向晚聊幾句就能扒出那個土耳其留學生的過幾,雖然現在的他尚不曾知道這件事。
莫向晚繼續問:「你還記不記得,在28年前後,文學市場被一群不明身份的人壟斷了?」
2028年是很久以前的事了。
作為第n次的時空穿越者,甄巧努力迴想了好幾分鍾,才想起來他指的是什麽。
那時候,市場湧現出了一批優秀的作家、時評家和媒體撰稿人。
尤其是網絡文學市場,百花齊放,從言情小說到燒腦懸疑,從沙雕腦洞文到架空歷史文,都有不少憑空出現的神筆作家:九月破歌、劉長青、風起烏賊……
「記得。」
「但是這些人從未出現過。無論是媒體採訪,還是作者大會,一次都沒有,網絡上能搜到這些人的信息,但沒一個人見過他們。」
甄巧愣住。
這些話很熟悉,好像在哪裏聽到過,在另一個時間線上。
「起初我並未在意,隻是覺得那些書爆火,受到讀者歡迎是理所當然的,因為寫的好。但是,他們完美得簡直不像人。即便是網絡版本,按理說是沒有精修過的,也找不到一絲錯誤,每個描寫都近乎完美。」
甄巧脫口而出:「說不定是寫作團隊?」不過話已出口,她隱約覺得這句話也在另一個時空裏問過。
莫向晚搖搖頭。
「直到有一天,我將九月破歌的《美人謀》導進了電腦,用語言處理模型跑了一下,發現了更嚴重的問題。」
「什麽問題?」甄巧好奇。
「類符形符比是8.64。這是衡量文章用詞豐富程度的指標,數字越高,代表用詞變化越多,作者詞彙量越豐富。」莫向晚的眼神倏然淩厲,「四字成語出現的頻率占比0.65%,平均句長12.18,平均句段長5.71。」
莫向晚終究是莫向晚,時隔這麽長時間,依舊能憑空背出準確的數據。
「我對語料庫不了解,這數值怎麽了?」甄巧在一無所知的狀態下,已經起了一身雞皮疙瘩。
「要知道,因為每個人都是不同個體,寫出來的文章風格也不盡相同。有些人喜歡用四字成語,所以文章的四字成語占比高;有些人喜歡寫長句子,那平均句長就長。這些指標綜合起來,是可以反映一個人的創作風格的。」
莫向晚說這些話的語氣,和他講課時的語氣很像,溫柔中帶著冰冷的嚴肅。
「明白了,」甄巧點點頭,「那這數據反映出九月破歌是怎樣的人呢?」
莫向晚沒有說話,隻是靜靜地看著她。
「怎麽了?」甄巧不解。
「九月破歌、劉長青、穿靴子的狗、解說老王……所有這些所謂的『作家』,但凡文長一些,數據都一模一樣。8.64,0.65%,12.18,5.71,0.36%,84.2。」
「一模一樣?」甄巧先愣了一會兒,緊接著反應過來了什麽,「你是說,他們是同一個人?」
「不,即便是同一個人,也不能保證每部作品,這些數值都一模一樣,更別提裝作不同的作家了。」
甄巧更迷惑了:「那是?」
「我一開始也沒想明白,明明就連ai生成也沒辦法保證這一點,除非每次寫完後都刻意保持,但沒有必要。」莫向晚咽了口口水,喉結上下移動,「直到我開始跑別人的數據。」
「跑誰的?」
「比如你媽媽的文,比如魯迅、餘秋雨、沈從文、蕭紅。他們的數據特徵就非常鮮明,都不一樣,而且差別很大。」
甄巧仍不明白他到底想說什麽;她隱隱覺得,真正的重點還在後麵。<hr>
好像有一雙眼睛在看他們。那雙眼睛融進了深淵,看不清輪廓,卻能感受到目光。
冷汗沒緣由地滲出脊背。
甄巧不由分說拉住他。
「走,迴家說。」
**
沒有冬天會比這個二月寒冷。
當他們談起這個話題時,身邊的溫度驟降,暖氣也成了萬裏寒冰。
整件事情實在過於複雜。
於是像之前幾次那樣,甄巧拿出一遝a4紙和不同顏色的記號筆,和莫向晚坐在沙發上思考。
若要從一堆混亂的線索中找出彼此的聯繫,必須要全部整理並直觀地寫下來,才有分析的餘地。
將莫向晚前幾次死亡日的行程列下來,唯一的交點隻有一個——去dhl寄郵件。
絕對有問題。
「你到底在研究什麽?」
「一些無關緊要的。」
「那請你告訴我。」
「我不能說。」
……
在甄巧再三逼問後,莫向晚終於打算說實話了。他舒展開修長的腿,後背靠在沙發上,仰頭看向天花板。
「母語可以決定人的思維方式,你知道吧。」
「嗯。」
「語言反應了人的意識。」
「嗯。」
這些都是甄巧在以前的時間線上,和莫向晚探討過的問題。曾經的她覺得語言學一無是處,現在的她對語言學心悅誠服。
「任何人發一段文字,通過特定的手段分析,都能從中推斷出一些信息。或是作者的性別,性格;或是作者的母語,寫作習慣,平日常讀什麽書。」
甄巧點點頭:「語言偵探。」
她曾親眼見證過,莫向晚聊幾句就能扒出那個土耳其留學生的過幾,雖然現在的他尚不曾知道這件事。
莫向晚繼續問:「你還記不記得,在28年前後,文學市場被一群不明身份的人壟斷了?」
2028年是很久以前的事了。
作為第n次的時空穿越者,甄巧努力迴想了好幾分鍾,才想起來他指的是什麽。
那時候,市場湧現出了一批優秀的作家、時評家和媒體撰稿人。
尤其是網絡文學市場,百花齊放,從言情小說到燒腦懸疑,從沙雕腦洞文到架空歷史文,都有不少憑空出現的神筆作家:九月破歌、劉長青、風起烏賊……
「記得。」
「但是這些人從未出現過。無論是媒體採訪,還是作者大會,一次都沒有,網絡上能搜到這些人的信息,但沒一個人見過他們。」
甄巧愣住。
這些話很熟悉,好像在哪裏聽到過,在另一個時間線上。
「起初我並未在意,隻是覺得那些書爆火,受到讀者歡迎是理所當然的,因為寫的好。但是,他們完美得簡直不像人。即便是網絡版本,按理說是沒有精修過的,也找不到一絲錯誤,每個描寫都近乎完美。」
甄巧脫口而出:「說不定是寫作團隊?」不過話已出口,她隱約覺得這句話也在另一個時空裏問過。
莫向晚搖搖頭。
「直到有一天,我將九月破歌的《美人謀》導進了電腦,用語言處理模型跑了一下,發現了更嚴重的問題。」
「什麽問題?」甄巧好奇。
「類符形符比是8.64。這是衡量文章用詞豐富程度的指標,數字越高,代表用詞變化越多,作者詞彙量越豐富。」莫向晚的眼神倏然淩厲,「四字成語出現的頻率占比0.65%,平均句長12.18,平均句段長5.71。」
莫向晚終究是莫向晚,時隔這麽長時間,依舊能憑空背出準確的數據。
「我對語料庫不了解,這數值怎麽了?」甄巧在一無所知的狀態下,已經起了一身雞皮疙瘩。
「要知道,因為每個人都是不同個體,寫出來的文章風格也不盡相同。有些人喜歡用四字成語,所以文章的四字成語占比高;有些人喜歡寫長句子,那平均句長就長。這些指標綜合起來,是可以反映一個人的創作風格的。」
莫向晚說這些話的語氣,和他講課時的語氣很像,溫柔中帶著冰冷的嚴肅。
「明白了,」甄巧點點頭,「那這數據反映出九月破歌是怎樣的人呢?」
莫向晚沒有說話,隻是靜靜地看著她。
「怎麽了?」甄巧不解。
「九月破歌、劉長青、穿靴子的狗、解說老王……所有這些所謂的『作家』,但凡文長一些,數據都一模一樣。8.64,0.65%,12.18,5.71,0.36%,84.2。」
「一模一樣?」甄巧先愣了一會兒,緊接著反應過來了什麽,「你是說,他們是同一個人?」
「不,即便是同一個人,也不能保證每部作品,這些數值都一模一樣,更別提裝作不同的作家了。」
甄巧更迷惑了:「那是?」
「我一開始也沒想明白,明明就連ai生成也沒辦法保證這一點,除非每次寫完後都刻意保持,但沒有必要。」莫向晚咽了口口水,喉結上下移動,「直到我開始跑別人的數據。」
「跑誰的?」
「比如你媽媽的文,比如魯迅、餘秋雨、沈從文、蕭紅。他們的數據特徵就非常鮮明,都不一樣,而且差別很大。」
甄巧仍不明白他到底想說什麽;她隱隱覺得,真正的重點還在後麵。<hr>