关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1181人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:上合组织因俄乌战事面临三重困境 中国迎来机遇

直新闻 浏览 63220

记者:弗里克听说自己的明夏离队传闻后说“又是胡说八道”

懂球帝 浏览 172

郭碧婷爸爸“打脸”向太:郭碧婷一人承担俩孩子开销

青途历史 浏览 471

加量不加价 阿维塔11鸿蒙版智享升级版30万起

网易汽车 浏览 12406

王家卫持续被扒

萌神木木 浏览 195

东体:申花充分利用体能优势,亚冠失利对蓉城士气的打击或许更大

直播吧 浏览 1145

泰慕士脱敏狂飙

富凯财经 浏览 1137

燕翔:A股上市公司增减持特征与近况

首席经济学家论坛 浏览 469

火箭加时惜败公牛!史密斯完美,3首发喜忧参半,惠特莫尔仍爆

篮球资讯达人 浏览 12370

中国最大城市群,越来越像一个“省”

国民经略 浏览 10973

一天开店12家!手握上市时间表盒马要争第一?

华夏时报 浏览 15159

韩国人终于把自己的“国运”给彻底玩没了

浏览 22459

特斯拉 Model Y L 交流外供电适配器上架,售价 599 元

IT之家 浏览 87

女星参加晚会丢2万元戒指 哭诉自己赔不起被吐槽

娱乐团长 浏览 12445

五角大楼泄露文件称台军难抵御大陆空袭 台军表尊重

环球网资讯 浏览 107471

以军先斩后奏空袭加沙多地 特朗普:以色列没做错

上观新闻 浏览 309

女子浑身酸痛疑被男同事强奸 警方查出男方才是受害者

社会奇闻君 浏览 89125

女星安吉丽娜·朱莉访乌 其随身保镖被乌军征兵处抓走服役

极目新闻 浏览 142

外媒:美对华威胁加税100% 极限施压报复北京近期举动

环球网资讯 浏览 3302

可变焦激光雷达 传祺向往S7 PRO+上市售15.98万起

网易汽车 浏览 982

魏晋贵族为什么把厕所装修得特别豪华?魏晋是中国历史上最黑暗的年代

趣看热点 浏览 25208
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1