关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1452人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

@切尔西 不能签卖身契了!欧足联新规:球员签约成本摊销上限5年

直播吧 浏览 15272

美媒:美国曾建全国防疫系统,但新冠疫情期间从未启用

央视 浏览 26925

上海一医院侧门疫情后封闭至今 官方回应病人无法接受

上观新闻 浏览 67725

极致轻量化 兰博基尼Temerario全新赛车发布

车质网 浏览 392

市值减少约7800亿元!汽车业上市公司巨震

汽车K线 浏览 724

钟楚曦合影风波升级!站C位评论区沦陷,杨幂刘亦菲差点没挤进去

萌神木木 浏览 665

全球交付25万架!百年飞机制造商深耕中国20余年,已成立两家合资公司

时代财经 浏览 18866

西班牙将向乌提供巨额军援 该国外援史上前所未有

参考消息 浏览 10816

58岁郭富城生图曝光!很帅但眼神浑浊,胸前有斑点被质疑是老年斑

文艺圈娱乐号 浏览 12833

提及俄乌问题 俄外长与美德等国外长发生激烈争吵

环球网资讯 浏览 19005

又一位维密天使结婚,“顶峰”相见的爱情太美了

VOGUE中国 浏览 15977

默克公司率先起诉美国政府:药品定价改革违宪了

财联社 浏览 16108

热巴《花少》被指表现过度!拿摄像机玩误删所有素材,打工人实惨

萌神木木 浏览 12571

金顺凯:没想到教练会用我;未来肯定想进国足,但差得还挺多

懂球帝 浏览 11977

记者:浙江男篮全队抗议&王奕博暴怒的原因是裁判辱骂了王奕博

直播吧 浏览 12848

看到洪水冲毁花莲桥梁大声讪笑 台官员被批"冷血"

澎湃新闻 浏览 1244

耶路撒冷遭火箭弹袭击 以色列使用"铁穹"拦截

CCTV国际时讯 浏览 12327

股价连跌6天,但泡泡玛特却在全球狂飙!

正解局 浏览 612

A股:一定会有大牛市,只是这个大牛市不是散户想要的

资本百科 浏览 11887

邮报列利物浦六大中场引援目标:帕利尼亚、杜库雷在列

直播吧 浏览 14337

孙铭徽赛季总助攻307次继续领跑国内球员榜 赵继伟居次&高诗岩第3

直播吧 浏览 19197
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1