关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者416人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

41岁凯特王妃带三娃坐树上!最疼爱的还是小儿子

译言 浏览 18905

春节在商场加班的卖车人:有人5天卖出20多台,有人卖一台净赚超2000元|钛度车库

钛媒体APP 浏览 11895

媒体:王毅会见乌克兰外长 释放三个不寻常的信号

北京日报客户端 浏览 19114

推广|| 新买的衣服人人夸!果然还得是他家

黎贝卡的异想世界 浏览 585

黄晓明自爆身体出问题,呼吁大家节食减肥一定要适度

趣看热点 浏览 25454

光阴的故事丨接力放映露天电影70载 他们用坚守点亮光影记忆

北青网-北京青年报 浏览 1093

半年内中行多名高管被查 1人被指是"逃逸式辞职"典型

政知新媒体 浏览 91349

OpenAI警告:版权打击可能摧毁ChatGPT

智通财经 浏览 12177

隐退4年后,张一鸣久违现身!互联网大佬正集体杀回

深蓝财经 浏览 568

戴尔科技集团发布2024财年ESG报告 重申ESG2025目标

网易科技报道 浏览 10201

拜登差点又被绊倒,这次他格外小心的稳住了脚步

趣看热点 浏览 1053274

今日热点:金鸡奖提名发布会;霉霉不出演超级碗中场秀的原因……

伊周潮流 浏览 1246

鼻梁通天却宛如慈悲佛面,被这张脸感动到了

新氧 浏览 13004

一天开店12家!手握上市时间表盒马要争第一?

华夏时报 浏览 15160

30 万一块的蔚来电池是怎么来的?

晚点LatePost 浏览 12409

23.98万起/中大型SUV定位 东风日产探陆开启预售

网易汽车 浏览 12227

新版医保目录今启用!这些企业的独家中成药将迎来新生?

上海证券报 浏览 26077

200块穿出高级感 通勤就这样穿!

她读 浏览 18931

国内牛肉价格稳健背后

北京商报 浏览 86

圣保利vs霍芬海姆:季维加瓦、藤田让瑠奇马首发,克拉马里奇、曹法尔出战

懂球帝 浏览 492

中国刚买完美国玉米特朗普就立马变脸 摆了中方一道

策略述 浏览 5040
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1