樣本?就是說你要1201同本地人多交流是嗎?”尹秋并沒有學(xué)過這些東西,因此聽起來云里霧里的,“可這樣必然進(jìn)入惡性循環(huán)——1201聽不懂,不回應(yīng),缺乏與本地人的互動,交流減少,而越不交流,1201就越聽不懂。”
1201所使用的學(xué)習(xí)方式,是比較新穎的“小樣本學(xué)習(xí)”(Few-shot learning)。這種樣本學(xué)習(xí)方式,不僅對機(jī)器學(xué)習(xí)領(lǐng)域有著重大意義,也同樣具有挑戰(zhàn)性。能否從少量樣本中學(xué)習(xí)和概括的能力,是將人工智能和人類智能進(jìn)行區(qū)分的明顯分界點(diǎn)。因?yàn)槿祟惪梢詢H通過少量示例就可以輕松地建立對新事物的認(rèn)知,而機(jī)器學(xué)習(xí)算法通常需要大量的有監(jiān)督樣本來保證泛化能力。
但由于隱私,安全性等一系列因素,許多現(xiàn)實(shí)的場景,例如醫(yī)學(xué),軍事等領(lǐng)域,根本無法收集到足夠的帶標(biāo)簽的訓(xùn)練樣本。因此,徐遠(yuǎn)風(fēng)才決定讓1201使用這種尚未完善的“小樣本學(xué)習(xí)”(Few-shot learning)訓(xùn)練方法。
徐遠(yuǎn)風(fēng)當(dāng)然不會跟尹秋說這些涉及專業(yè)知識的方面,他要用更簡單的方法來解釋。
“樣本,我需要各類方言的樣本,你要知道,我們訓(xùn)練AI不是憑空訓(xùn)練的,樣本非常重要?!毙爝h(yuǎn)風(fēng)一邊解釋,一邊拿起紙筆,在紙上畫著,好讓尹秋能理解他說的話。
“比如,有些公司做的是繪畫的AI,就需要將很多畫作當(dāng)做樣本給AI做訓(xùn)練?!毙爝h(yuǎn)風(fēng)在紙上簡單地畫了個思維圖,“而有些創(chuàng)作者,為了省力,他們會將自己的畫作作為樣本,這種行為,有些人會稱為‘喂’,比如說,把自己的畫‘喂’給AI,這樣AI就能以你的畫風(fēng)來進(jìn)行AI作畫?!?/p>
“同樣的道理,想要AI理解方言,也是需要將各種不同地區(qū)的方言,甚至于各種語速、情緒來‘喂’給AI?!?/p>
“所以你需要一個能涵蓋當(dāng)?shù)馗鞣N方言,甚至各種年齡段、各種情緒的樣本是嗎?”尹秋聽了,只是覺得這樣難度過高,而且別人也不是閑的沒事干,把鄉(xiāng)親們從日常生活中拉出來跟1201說話,怕不是要不少經(jīng)費(fèi)。
“我知道你在想什么,你可能覺得需要經(jīng)費(fèi),但實(shí)際上不需要,因?yàn)槟壳斑@個階段我們的數(shù)據(jù)模型只負(fù)責(zé)接受各種方言,然后進(jìn)行分析就好,而不是方言方面的輸出。這也就是前些天明明出了方言不能識別那種事,我還要將1201帶出去測試的原因——它需要足夠的積累?!?/p>
“年輕人工作重要,但身體也重要,來新疆要好好調(diào)整作息,才能勞逸結(jié)合?!卑⒁郎髬鹫驹陂T口,出聲提醒二人,免得二人因?yàn)樘爝€亮著就不去睡覺,導(dǎo)致明天工作出問題。
“好的,我們會注意時間的。”尹秋笑著回應(yīng)。
徐遠(yuǎn)風(fēng)伸長脖子,見大嬸上樓后,小聲說:
“你說大嬸會不會發(fā)現(xiàn)咱倆的關(guān)系吧?天天交流這么多。”
尹秋感到好笑,感情沒破裂那段時間,徐遠(yuǎn)風(fēng)下班沒事的時候恨不得黏在自己身上,現(xiàn)在倒還注意起影響來了?
“都說了是工作的事情,大嬸不會懷疑的?!?/p>
“也是,”徐遠(yuǎn)風(fēng)轉(zhuǎn)向桌前,“我要寫代碼了,你自己玩吧?!?/p>
“哄小孩呢?”尹秋這下真給徐遠(yuǎn)風(fēng)逗得笑出聲了。
她轉(zhuǎn)身上樓,回到自己房間。
尹秋也有事要做,經(jīng)過下午的討論與主任的拍板,他們決定拍一個宣傳視頻——不用航拍,也不用很高端的剪輯技巧,而是用最樸實(shí)的方法記錄古城最真實(shí)的美好瞬間。
雖然樸實(shí),但該做的事情還是要做,她需要先寫出一個視頻腳本。這樣,不論是回頭外包給其他公司還是融媒體中心自己拍都能有一個基本的參照。
提到這個,她就有些來氣。
討論的時候特意提到了視頻拍攝是否要外包出去的問題,主任堅(jiān)持“專業(yè)的事情讓專業(yè)的人來干”,而她多年的工作經(jīng)歷告訴她,外包的公司常常為了體現(xiàn)自身的“專業(yè)性”,會在里面加“高端大氣”的剪輯和手法,這樣很明顯和他們之前的初衷背道而馳。
至于張饒,在二人討論得熱火朝天的時候猛打圓場和稀泥。
閉上雙眼,她回憶起了之前在古城里看見的木雕工藝……
思路打開——
跟隨鏡頭的步伐,穿過充滿著維吾爾特色的大街小巷,走進(jìn)古城的深處,一個招牌顯現(xiàn)出歷史的厚重與滄桑。
走入小店,映入眼簾的是一張小小的桌板。幾個木雕和木碗被隨意地?cái)[放在桌板上。
更深處,一群人圍在一起。人群中間,老師傅正舉著電烙,在木頭上畫著些什么……
木頭散發(fā)的淡淡煙霧在屋內(nèi)飄散,燃燒出的煙霧顏色比江南地區(qū)的水霧更白,在煙霧的籠罩下,老師傅的臉帶著些許神秘。
充滿著藝術(shù)氣息的木雕放下時,還冒著絲絲煙霧……
煙霧之中,傳承已久的技術(shù)具象化了。
江主任在這里呆了那么多年,這個木雕店他也去過,因此也沒有感到多少對技術(shù)的崇拜。不過,江主任確實(shí)感受到了什么叫做“六年的工作經(jīng)驗(yàn)”。
“煙火氣呢?”尹秋幾天就掏出來個視頻,讓張饒倍感意外,不過該提出的問題還要提。
“喏,煙火,”尹秋將視頻倒回去一些,指著烙鐵燃起來的煙?!皦蚓呦罅税??!?/p>
“夠了夠了,這也太具象了。”江主任和張饒異口同聲。
“等一下,還有一個問題,”張饒的疑問并沒有完全被解答,“為啥你這個開頭,有些抖呢?”
“我特意沒將防抖拉滿,”尹秋早料到會被問到這種問題,“這樣可以增加觀眾的沉浸感,不會顯得高高在上,所以我將防抖放在了一個界限內(nèi),既讓觀眾看得清楚,看得舒服,又能讓觀眾感受出來畫面確實(shí)在跟隨著步伐抖動?!?/p>
看到這里,江主任也反應(yīng)過來:“你視頻中的煙火氣,不在于表面上的人多或者刻意堆砌的熱鬧,而在于真實(shí)?”