非洲的網際網路經濟預計在2025年達到1800億美元,並可能在2050年激增至7120億美元。人工智慧(AI)被認為是推動此增長的主要引擎,AI市場預估到2030年將達到165億美元。然而,語言的多樣性將決定這種增長是包容性的還是排斥性的。非洲大陸多達2000多種語言,如果科技未能以非洲人每日使用的語言溝通,數位經濟將無法充分實現其潛力。
自然語言處理(NLP),亦即讓機器理解和生成人類語言的AI分支,是關鍵所在。全球範圍內,NLP驅動語音助手、聊天機器人以及翻譯系統的運作。在非洲,其重要性尤為突出,因為大多數數位平台依然是單一語言,通常默認為英語或法語。這造成了大規模的排斥現象。網上內容僅有0.02%是非洲語言,致使AI模型對於如約魯巴語、斯瓦希里語、祖魯語、豪薩語、阿姆哈拉語及其他數百種語言完全無能為力。
聯合國教科文組織(UNESCO)早已警告,若不進行數位化,全球3000多種語言,許多是非洲語言,可能會在2100年消失。即便是數以千萬計的人使用的語言,在AI時代也有被邊緣化的風險。
這種現象的後果是真實而深遠的。在奈及利亞,針對選民教育的公民科技工具通常不包含豪薩語、約魯巴語和伊博語。肯亞的斯瓦希里語使用者難以使用默認為英語的數位平台。全非洲,大量公民無法以自己的母語獲取服務,研究者稱之為“數位空間中的語言不平等”。這不僅是文化議題,亦是經濟問題。如果數位服務沒有納入本地語言,採用速度會減慢,信任度下降,社會的大片區域將無法分享網路經濟所帶來的益處。
然而,機遇是巨大的。NLP技術可以將非洲的語言多樣性轉化為競爭優勢。在金融科技領域,能理解皮欽語、豪薩語或斯瓦希里語的聊天機器人已經擴大了銀行業的接觸面。奈及利亞的金融科技公司如Kudi.ai,使用英語和當地語言的對話界面,提供小額貸款與行動支付。在醫療領域,肯亞的Uliza Llama聊天機器人在五種非洲語言中提供孕產健康建議,而在馬拉威,UlangiziAI則通過WhatsApp用契切瓦語回答農民的問題,將回應時間從數日縮短至幾秒。教育方面,AI導師和閱讀助手以母語進行教學,提升了識字率和理解力。政府也開始響應,南非與肯亞的公民平台正在試驗多語聊天機器人,讓市民能用祖魯語、斯瓦希里語等語言來互動。
若干開創性計劃顯示出這股浪潮的動力。奈及利亞開發的YorubaGPT是一個基於約魯巴語文本訓練的聊天機器人,在服務超過5000萬約魯巴語使用者的同時保持了成語、諺語及文化細節。Masakhane計劃這個泛非研究團體,正在為數十個非洲語言對建立機器翻譯模型,展現了合作的力量。2024年,南非的Lelapa AI發佈了InkúbaLM,該大陸的第一個多語大型語言模型,支持斯瓦希里語、約魯巴語、豪薩語、西索托語及祖魯語。全球大型企業也開始注意。Google近期已在Translate、Gboard和語音識別中加入30多種非洲語言,這使3000萬非洲人能用語音來與網路進行互動。
需要克服的障礙
然而,障礙依然顯著。最主要的是數據匱乏。大部分非洲語言欠缺訓練AI模型所需的大量乾淨數據集。許多語言主要是口語,有非標準化的書寫系統,或者聲調複雜,不易被傳統模型處理。基礎設施是另一個關鍵限制。訓練高級NLP模型需要GPU、可靠的電力和高速網路,這些資源在大陸多數地區仍然短缺。技術人才也不足。目前非洲約有70萬名軟體開發者,卻只有少部分接受過AI和NLP訓練,許多人還因“人才流失”問題而流失。資金主要流向金融科技及物流初創企業,使得語言技術在資源上顯得捉襟見肘,儘管其長期重要性不容小覷。而政策框架尚未跟上步伐。很少有政府要求提供多語數位服務或投資於國家語言數據集。然而,肯亞和南非已開始將AI納入國家戰略之中。
未來的願景
儘管挑戰重重,前路仍清晰可見。政府應要求公民數位服務必須以當地語言提供,以創造對NLP解決方案的即時需求。投資者應意識到,接下來的5億個非洲新用戶將主要用本地語言上網,NLP將成為全新市場的大門。大學和社區需擴展訓練,建立數據集,支持Masakhane等開源計劃。科技公司必須致力於為非洲製造非洲語言的產品,否則將冒失去其平台相關性的風險。
這是個吸引人的願景。想像一下,塞內加爾的農民使用沃洛夫語向AI諮詢種植作物,德班的青少年用祖魯語AI導師學習編程,卡諾的病患用豪薩語描述病症,拉各斯的議會利用AI即時翻譯辯論,跨越約魯巴語、豪薩語、伊博語和英語。這些場景均非遙不可及。共同它們描繪了一個科技依需適應人的大陸,而非相反。
非洲的語言多樣性,曾被視為一種障礙,如今可能成為AI時代最大的優勢。通過擁抱NLP,非洲不僅能解鎖其數位經濟,還能設立一個包容性科技的全球標準。1800億美元設定的不僅是經濟目標;它代表了數以百萬計的民眾進入數位社會。保護非洲語言在AI中的生命力,不只是文化遺產的問題,而是確保未來沒有誰被排除於良機之外。大陸有機會領導世界,證明當AI能用每個人的語言說話時,科技將變得更加人性化、更加包容和更加公正。