关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家411人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

颠覆认知!用这8把“尺子”重新丈量中国餐饮未来!

餐饮老板内参 浏览 373

被这位姐姐圈粉!5件单品3种搭配立刻年轻20岁

小陈聊搭配 浏览 13697

嫦娥六号、载人航天、鹊桥二号……中国航天今年有这些看点

澎湃新闻 浏览 11809

好看显瘦的本质就是清爽简约,记住这6个核心搭配思路!

日系志Yumi 浏览 12030

伊朗海军司令宣布海湾地区将组建新的海军联盟

海外网 浏览 15632

69岁赵雅芝真实面容曝光 生图眼尾皱纹炸花显老态

盖饭娱乐官方号 浏览 18267

美众院通过修正案 或禁止美军从中俄购买数字显示器

澎湃新闻 浏览 21086

NVIDIA 向英特尔投资 50 亿美元 共同开发 AI 基础设施和个人计算产品

经济观察报 浏览 432

网红为博眼球,偷溜进高校解剖室摆拍

趣看热点 浏览 24810

有反转?王力宏方发声否认李靓蕾在美国胜诉

网易娱乐 浏览 16035

印度阵风又被击落,为啥法国战机如此不堪?

浏览 3641

有效学习港风穿搭 30年后也不过时

YOKA网 浏览 13405

泽连斯基:乌克兰将对非短缺武器实施受控出口

政知新媒体 浏览 94

巴基斯坦与沙特签协议被指影响超越中东 引发多国震动

环球网资讯 浏览 10803

安徽蚌埠办音乐节在桥上建围挡引质疑 几天后又拆除

环球网资讯 浏览 87586

今年的牛仔裙 主打就是长!

国际纺织品流行趋势 浏览 17660

在WWDC上 苹果不会宣布任何新的硬件

威锋网 浏览 9889

江恩:什么是波段操作的铁律?3条准则看似简单,95%的人却做不到

60秒商业解读 浏览 11038

媒体:拜登说漏了?美国有毁灭台湾计划?

环球网资讯 浏览 18131

能抵御核弹袭击的水坝断裂 专家:或是内部爆破

上游新闻 浏览 15365

十几位主播围住96岁摆摊奶奶蹭流量,网友直呼疯子们饶了奶奶吧!

趣看热点 浏览 24357
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1