这个杀手不太冷静主演是谁 该剧什么时候上映2022河南疫情最新消息输赢骆伽死亡真相是什么 原著中骆伽是怎么死的镜双城西京和汀结局分别是什么天津:放假半天启动第二轮全员核酸检测开端原著小说有没有感情戏 肖鹤云和李诗情在一起了没有2022天猫年货节红包雨入口长津湖之水门桥定档了吗 什么时候播出2022天猫年货节超级红包怎么领镜双城结局是什么是悲剧吗 苏摹最后是死了吗镜双城炎汐喜欢谁 炎汐结局是什么汤加是最早进入新一天的国家 汤加为什么是最早迎来日出的国家汤加为什么那么多中国人 汤加火山爆发有中国人伤亡吗汤加火山喷发活跃期会持续多久 汤加火山已苏醒开端最后抓到凶手了吗 开端小说中凶手是谁中国人口2021总人数口是多少 全国人口14.126亿腾讯游戏寒假可以玩多长时间 寒假未成年人最多玩14小时游戏2022年腾讯游戏寒假暨春节假期未成年人限玩时间安排汤加火山位置具体在哪里 汤加离中国多远2022北京有疫情了吗最近 北京疫情最新情况过年能回家吗上海燃放烟花爆竹范围2022 2022年上海燃放烟花爆竹范围是哪些emoha是什么意思 emoha什么梗今年为啥没有大年三十 为什么2021没有大年三十春节进入北京需要做核酸检测吗 2022春节进京人员最新政策哪5个省不准回去过年 不能回家过年的省份2022北京出京入京最新通知 哪些人不能进入北京2022年1月22日起进返京人员具体有哪些规定 进入北京新规定今年为啥没有大年三十 没有大年三十的原因是什么春节回福州要隔离14天吗 春节回福州要交核酸检测吗2022年福州返乡最新通知 福州疫情防控最新公告汤加海底火山再次大喷发 为何这次火山喷发会如此猛烈虎鹤妖师录主演是谁镜双城结局去归墟是梦吗 苏摹最后是死了吗《完美伴侣》吴敏婚姻还可以继续吗《雪中悍刀行》徐凤年为什么不把虎夔送给大姐《镜·双城》更新时间表 一周更新几集每周几点更新镜双城为什么鲛人一生一世只能爱一个人 鲛人真的存在过吗《镜双城》西京喜欢的是谁 《镜双城》西京结局是什么镜双城苏摩对朱颜是什么感情 苏摩喜欢白璎还是朱颜镜双城苏摩跟几个女的有关系啊 苏摩和谁做过《完美伴侣》陈珊检查后确认怀上二胎了《王牌部队》江南征为何能守望幸福 与母亲江宜慧密不可分《完美伴侣》吴敏和林庆昆的矛盾又升级了《流光之城》主要讲了什么故事呢《江湖宅女记》是什么剧《家族荣耀》主要角色最后结局分别是什么《雪中悍刀行》韩貂寺口中的“绝色”指的是谁《流光之城》是根据什么小说改编的《流光之城》讲了什么故事开端追剧日历 开端什么时候更新01月17日班玛全天候天气实时报
您的位置:首页>行业动态>

新的人工智能将自然语言处理的力量带到非洲语言中

导读研究人员开发了一种人工智能模型,以帮助计算机更有效地使用更广泛的语言。非洲语言很少受到计算机科学家的关注,因此非洲的大片地区几乎没

研究人员开发了一种人工智能模型,以帮助计算机更有效地使用更广泛的语言。

非洲语言很少受到计算机科学家的关注,因此非洲的大片地区几乎没有自然语言处理能力。滑铁卢大学 David R. Cheriton 计算机科学学院的研究人员开发的新语言模型开始填补这一空白,使计算机能够分析非洲语言文本以执行许多有用的任务。

研究人员称之为 AfriBERTa 的新神经网络模型使用深度学习技术为低资源语言实现了最先进的结果。

该神经语言模型专门用于 11 种非洲语言,例如阿姆哈拉语、豪萨语和斯瓦希里语,这些语言的总人数超过 4 亿。尽管仅从 1 GB 的文本中学习,但它实现了与现有最​​佳模型相媲美的输出质量,而其他模型需要数千倍的数据。

滑铁卢大学计算机科学硕士生 Kelechi Ogueji 说:“预训练的语言模型已经改变了计算机处理和分析从机器翻译到问答等任务的文本数据的方式。”“可悲的是,非洲语言几乎没有受到研究界的关注。”

“其中一个挑战是神经网络的构建需要大量的文本和计算机。与拥有大量可用文本的英语不同,全世界使用的大约 7,000 种语言中的大多数都可以归为资源匮乏的特征,因为缺乏可用的数据来馈送数据饥渴的神经网络。”

大多数这些模型使用称为预训练的技术工作。为了实现这一点,研究人员向模型展示了一些文字被掩盖或掩盖的文本。然后模型必须猜测被屏蔽的词。通过重复这个过程数十亿次,该模型学习了单词之间的统计关联,这模仿了人类的语言知识。

“能够对某些下游任务同样准确的模型进行预训练,但使用极少的数据有很多优势,”计算机科学 Cheriton 主席兼 Ogueji 的顾问 Jimmy Lin 说。“需要更少的数据来训练语言模型意味着需要更少的计算,从而降低与运营海量数据中心相关的碳排放。较小的数据集也使数据管理更实用,这是减少模型中存在的偏差的一种方法。”

标签:

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。