青海湖畔,湛藍(lán)湖水與綿延草場的交織和諧,生命之源滋養(yǎng)著歷史與文明的繁榮延續(xù)。在這里,青海正以一種全新方式與時(shí)代共振。承載著諸多智慧結(jié)晶的藏文歷經(jīng)千年傳承演變,在數(shù)字化時(shí)代的當(dāng)下迎來了“煥然新生”。
智能技術(shù)搭建數(shù)字化“基石”
在位于青海省西寧市的青海師范大學(xué),坐落著全國目前唯一一座藏語信息處理領(lǐng)域的國家重點(diǎn)實(shí)驗(yàn)室。從2021年開始,幾年時(shí)間,這座藏語智能全國重點(diǎn)實(shí)驗(yàn)室(以下簡稱“國重實(shí)驗(yàn)室”)快速建設(shè)成長,重點(diǎn)研發(fā)出班智達(dá)翻譯、詞典、識(shí)別、文獻(xiàn)檢索、藏醫(yī)藥智能服務(wù)、智能圖譯等多款智能產(chǎn)品,方便了藏語言文字的日常智能使用與傳播。
圖為青海師范大學(xué)藏語智能全國重點(diǎn)實(shí)驗(yàn)室內(nèi)部 攝影:王妍丹
面向大模型時(shí)代,以“智慧”含義命名的“班智達(dá)”系列軟件產(chǎn)品在多語言大模型上深度耕耘?!鞍嘀沁_(dá)的傳統(tǒng)優(yōu)勢在于機(jī)器翻譯,我們一直在做漢藏、藏漢機(jī)器翻譯,主要關(guān)注放在新聞、公文和法律翻譯這三大領(lǐng)域。同時(shí)我們的機(jī)器翻譯也是向多語言的方向在發(fā)展,更多語種納入進(jìn)來,形成更加廣泛的受眾面和服務(wù)領(lǐng)域?!眹貙?shí)驗(yàn)室教授多拉告訴記者。
圖為青海師范大學(xué)藏語智能全國重點(diǎn)實(shí)驗(yàn)室的內(nèi)部 攝影:王妍丹
走進(jìn)國重實(shí)驗(yàn)室,記者現(xiàn)場觀摩“班智達(dá)”產(chǎn)品的最新模型試用,當(dāng)實(shí)驗(yàn)室成員點(diǎn)擊“語音識(shí)別”功能按鈕后,無論輸入藏語還是漢語,機(jī)器識(shí)別翻譯出的語言都相當(dāng)準(zhǔn)確。對(duì)于多地方言的識(shí)別難關(guān),國重實(shí)驗(yàn)室也已經(jīng)得到了地區(qū)試用的良性反饋,識(shí)別率正在穩(wěn)步上升。
圖為青海省海南藏族自治州的“云藏”搜索 攝影:王妍丹
在數(shù)字化的潮流之下,各類藏文網(wǎng)站成為藏語言文化交流的重要平臺(tái),成為知識(shí)匯聚、文化傳播的新陣地。在青海省海南藏族自治州,“云藏”搜索在八年的時(shí)間里致力于權(quán)威藏文搜索引擎的打造,構(gòu)建形成了大型藏文網(wǎng)絡(luò)系統(tǒng)。以全網(wǎng)搜索為核心,以多維信息服務(wù)和精準(zhǔn)搜索為體驗(yàn),“云藏”也被廣大網(wǎng)民譽(yù)為藏文版“百度”。
“90多個(gè)國家和地區(qū)有訪問到我們的系統(tǒng),云藏平臺(tái)向廣大用戶真實(shí)立體地再現(xiàn)了在黨的民族政策光輝照耀下,涉藏地區(qū)發(fā)生的一些翻天覆地的變化?!焙D现莶匚男畔⒓夹g(shù)研究中心多科介紹道,用戶可以通過“云藏”平臺(tái)使用云藏搜索、新聞、百科、文庫、知道、音頻、視頻、圖片這八大板塊內(nèi)容,了解各類文字和音視頻內(nèi)容信息。
智能時(shí)代煥發(fā)傳承創(chuàng)新的“數(shù)字光芒”
在科技飛速發(fā)展的當(dāng)下,無論是古老經(jīng)書中歷經(jīng)歲月滄桑的藏文書寫,還是現(xiàn)代手寫筆記中風(fēng)格各異的藏文字體,都能夠借助人工智能算法獲得更為精準(zhǔn)的識(shí)別。美麗的藏文書寫,在人工智能時(shí)代正在迎來更為嶄新的數(shù)字化進(jìn)程。
圖為海南藏族自治州的“云藏”搜索內(nèi)部 攝影:王妍丹
“圍繞優(yōu)秀傳統(tǒng)文化的保護(hù),我們國重實(shí)驗(yàn)室也做了一些工作,比如2024年發(fā)布了藏文文獻(xiàn)檢索系統(tǒng)和藏醫(yī)藥服務(wù)平臺(tái),這都是面向優(yōu)秀傳統(tǒng)文化的一些服務(wù)體系。”國重實(shí)驗(yàn)室教授多拉表示,在傳統(tǒng)文化保護(hù)領(lǐng)域,各方需要進(jìn)一步形成合力,如果在資源共享方面形成共識(shí)和協(xié)同創(chuàng)新,將能創(chuàng)造出非常出彩的產(chǎn)品。
圖為海南藏族自治州的“云藏”搜索內(nèi)部 攝影:王妍丹
藏文古籍、壁畫、唐卡等文化瑰寶,經(jīng)由數(shù)字化修復(fù)與保護(hù)后重?zé)ㄉ鷻C(jī)。基于人工智能構(gòu)建的藏文化知識(shí)圖譜,將分散在各處的藏文文化知識(shí)碎片串聯(lián)起來,在網(wǎng)絡(luò)世界形成了全面系統(tǒng)的文化導(dǎo)覽。依托海南藏族自治州的大數(shù)據(jù)產(chǎn)業(yè),“云藏”搜索引入國家重點(diǎn)實(shí)驗(yàn)室等多方展開合作交流,努力匯聚起青海藏文信息產(chǎn)業(yè)發(fā)展的力量。
圖為“云藏”搜索引入國家重點(diǎn)實(shí)驗(yàn)室展開合作交流 攝影:王妍丹
值得期待的是,“班智達(dá)”系列軟件產(chǎn)品在原有幾款產(chǎn)品的基礎(chǔ)上,將于2025年推出2.0系列產(chǎn)品?!鞍嘀沁_(dá)AI”作為大模型,國重實(shí)驗(yàn)室將把所有產(chǎn)品集中到一款A(yù)PP上,主要是實(shí)現(xiàn)功能的齊聚從而方便用戶的使用。
古老藏語言文化正在借助現(xiàn)代科技,逐步走向更廣闊的世界舞臺(tái)。藏文數(shù)字化之路也許漫長,但在各方的齊心不懈努力之下,這一寶貴的文化遺產(chǎn)必將在新時(shí)代煥發(fā)出全新光芒。(中國西藏網(wǎng) 記者/王妍丹 袁星宇 韓璐)
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。