樣本?就是說(shuō)你要1201同本地人多交流是嗎?”尹秋并沒(méi)有學(xué)過(guò)這些東西,因此聽(tīng)起來(lái)云里霧里的,“可這樣必然進(jìn)入惡性循環(huán)——1201聽(tīng)不懂,不回應(yīng),缺乏與本地人的互動(dòng),交流減少,而越不交流,1201就越聽(tīng)不懂。”
1201所使用的學(xué)習(xí)方式,是比較新穎的“小樣本學(xué)習(xí)”(Few-shot learning)。這種樣本學(xué)習(xí)方式,不僅對(duì)機(jī)器學(xué)習(xí)領(lǐng)域有著重大意義,也同樣具有挑戰(zhàn)性。能否從少量樣本中學(xué)習(xí)和概括的能力,是將人工智能和人類(lèi)智能進(jìn)行區(qū)分的明顯分界點(diǎn)。因?yàn)槿祟?lèi)可以?xún)H通過(guò)少量示例就可以輕松地建立對(duì)新事物的認(rèn)知,而機(jī)器學(xué)習(xí)算法通常需要大量的有監(jiān)督樣本來(lái)保證泛化能力。
但由于隱私,安全性等一系列因素,許多現(xiàn)實(shí)的場(chǎng)景,例如醫(yī)學(xué),軍事等領(lǐng)域,根本無(wú)法收集到足夠的帶標(biāo)簽的訓(xùn)練樣本。因此,徐遠(yuǎn)風(fēng)才決定讓1201使用這種尚未完善的“小樣本學(xué)習(xí)”(Few-shot learning)訓(xùn)練方法。
徐遠(yuǎn)風(fēng)當(dāng)然不會(huì)跟尹秋說(shuō)這些涉及專(zhuān)業(yè)知識(shí)的方面,他要用更簡(jiǎn)單的方法來(lái)解釋。
“樣本,我需要各類(lèi)方言的樣本,你要知道,我們訓(xùn)練AI不是憑空訓(xùn)練的,樣本非常重要。”徐遠(yuǎn)風(fēng)一邊解釋?zhuān)贿吥闷鸺埞P,在紙上畫(huà)著,好讓尹秋能理解他說(shuō)的話(huà)。
“比如,有些公司做的是繪畫(huà)的AI,就需要將很多畫(huà)作當(dāng)做樣本給AI做訓(xùn)練。”徐遠(yuǎn)風(fēng)在紙上簡(jiǎn)單地畫(huà)了個(gè)思維圖,“而有些創(chuàng)作者,為了省力,他們會(huì)將自己的畫(huà)作作為樣本,這種行為,有些人會(huì)稱(chēng)為‘喂’,比如說(shuō),把自己的畫(huà)‘喂’給AI,這樣AI就能以你的畫(huà)風(fēng)來(lái)進(jìn)行AI作畫(huà)。”
“同樣的道理,想要AI理解方言,也是需要將各種不同地區(qū)的方言,甚至于各種語(yǔ)速、情緒來(lái)‘喂’給AI。”
“所以你需要一個(gè)能涵蓋當(dāng)?shù)馗鞣N方言,甚至各種年齡段、各種情緒的樣本是嗎?”尹秋聽(tīng)了,只是覺(jué)得這樣難度過(guò)高,而且別人也不是閑的沒(méi)事干,把鄉(xiāng)親們從日常生活中拉出來(lái)跟1201說(shuō)話(huà),怕不是要不少經(jīng)費(fèi)。
“我知道你在想什么,你可能覺(jué)得需要經(jīng)費(fèi),但實(shí)際上不需要,因?yàn)槟壳斑@個(gè)階段我們的數(shù)據(jù)模型只負(fù)責(zé)接受各種方言,然后進(jìn)行分析就好,而不是方言方面的輸出。這也就是前些天明明出了方言不能識(shí)別那種事,我還要將1201帶出去測(cè)試的原因——它需要足夠的積累。”
“年輕人工作重要,但身體也重要,來(lái)新疆要好好調(diào)整作息,才能勞逸結(jié)合。”阿依莎大嬸站在門(mén)口,出聲提醒二人,免得二人因?yàn)樘爝€亮著就不去睡覺(jué),導(dǎo)致明天工作出問(wèn)題。
“好的,我們會(huì)注意時(shí)間的。”尹秋笑著回應(yīng)。
徐遠(yuǎn)風(fēng)伸長(zhǎng)脖子,見(jiàn)大嬸上樓后,小聲說(shuō):
“你說(shuō)大嬸會(huì)不會(huì)發(fā)現(xiàn)咱倆的關(guān)系吧?天天交流這么多。”
尹秋感到好笑,感情沒(méi)破裂那段時(shí)間,徐遠(yuǎn)風(fēng)下班沒(méi)事的時(shí)候恨不得黏在自己身上,現(xiàn)在倒還注意起影響來(lái)了?
“都說(shuō)了是工作的事情,大嬸不會(huì)懷疑的。”
“也是,”徐遠(yuǎn)風(fēng)轉(zhuǎn)向桌前,“我要寫(xiě)代碼了,你自己玩吧。”
“哄小孩呢?”尹秋這下真給徐遠(yuǎn)風(fēng)逗得笑出聲了。
她轉(zhuǎn)身上樓,回到自己房間。
尹秋也有事要做,經(jīng)過(guò)下午的討論與主任的拍板,他們決定拍一個(gè)宣傳視頻——不用航拍,也不用很高端的剪輯技巧,而是用最樸實(shí)的方法記錄古城最真實(shí)的美好瞬間。
雖然樸實(shí),但該做的事情還是要做,她需要先寫(xiě)出一個(gè)視頻腳本。這樣,不論是回頭外包給其他公司還是融媒體中心自己拍都能有一個(gè)基本的參照。
提到這個(gè),她就有些來(lái)氣。
討論的時(shí)候特意提到了視頻拍攝是否要外包出去的問(wèn)題,主任堅(jiān)持“專(zhuān)業(yè)的事情讓專(zhuān)業(yè)的人來(lái)干”,而她多年的工作經(jīng)歷告訴她,外包的公司常常為了體現(xiàn)自身的“專(zhuān)業(yè)性”,會(huì)在里面加“高端大氣”的剪輯和手法,這樣很明顯和他們之前的初衷背道而馳。
至于張饒,在二人討論得熱火朝天的時(shí)候猛打圓場(chǎng)和稀泥。
閉上雙眼,她回憶起了之前在古城里看見(jiàn)的木雕工藝……
思路打開(kāi)——
跟隨鏡頭的步伐,穿過(guò)充滿(mǎn)著維吾爾特色的大街小巷,走進(jìn)古城的深處,一個(gè)招牌顯現(xiàn)出歷史的厚重與滄桑。
走入小店,映入眼簾的是一張小小的桌板。幾個(gè)木雕和木碗被隨意地?cái)[放在桌板上。
更深處,一群人圍在一起。人群中間,老師傅正舉著電烙,在木頭上畫(huà)著些什么……
木頭散發(fā)的淡淡煙霧在屋內(nèi)飄散,燃燒出的煙霧顏色比江南地區(qū)的水霧更白,在煙霧的籠罩下,老師傅的臉帶著些許神秘。
充滿(mǎn)著藝術(shù)氣息的木雕放下時(shí),還冒著絲絲煙霧……
煙霧之中,傳承已久的技術(shù)具象化了。
江主任在這里呆了那么多年,這個(gè)木雕店他也去過(guò),因此也沒(méi)有感到多少對(duì)技術(shù)的崇拜。不過(guò),江主任確實(shí)感受到了什么叫做“六年的工作經(jīng)驗(yàn)”。
“煙火氣呢?”尹秋幾天就掏出來(lái)個(gè)視頻,讓張饒倍感意外,不過(guò)該提出的問(wèn)題還要提。
“喏,煙火,”尹秋將視頻倒回去一些,指著烙鐵燃起來(lái)的煙。“夠具象了吧。”
“夠了夠了,這也太具象了。”江主任和張饒異口同聲。
“等一下,還有一個(gè)問(wèn)題,”張饒的疑問(wèn)并沒(méi)有完全被解答,“為啥你這個(gè)開(kāi)頭,有些抖呢?”
“我特意沒(méi)將防抖拉滿(mǎn),”尹秋早料到會(huì)被問(wèn)到這種問(wèn)題,“這樣可以增加觀(guān)眾的沉浸感,不會(huì)顯得高高在上,所以我將防抖放在了一個(gè)界限內(nèi),既讓觀(guān)眾看得清楚,看得舒服,又能讓觀(guān)眾感受出來(lái)畫(huà)面確實(shí)在跟隨著步伐抖動(dòng)。”
看到這里,江主任也反應(yīng)過(guò)來(lái):“你視頻中的煙火氣,不在于表面上的人多或者刻意堆砌的熱鬧,而在于真實(shí)?”