12月25日上午消息,日前,计算机国际声学、语音与信号处理会议ICASSP 2025公布论文录用名单,由巨人网络AI实验室与浙江大学合作的语音研究成果入选ICASSP 2025。该成果提出了一种精准提升音频语言模型性能的创新方法,在实验结果中达到该领域最优效果。

据悉,国际声学、语音与信号处理会议 (International Conference on Acoustics, Speech and Signal Processing, 简称ICASSP) 是全世界最大、最全面的信号处理及其应用方面的顶级会议。作为国际电子技术与信息科学工程师协会 (Institute of Electrical and Electronics Engineers,简称IEEE) 的重要会议之一,在国际上享有盛誉并具有广泛的学术影响力。
巨人网络AI实验室与浙江大学研究团队在合作论文《Multiple Consistency-guided Test-Time Adaptation for Contrastive Audio-Language Models with Unlabeled Audio》中,提出了一种无需标注标签的多重引导提示学习方法,提升了音频分类零样本学习上的效果,为后续在视频配音(Video-to-Audio,V2A)任务上提供精准支持。
根据实验结果,与最先进的模型相比,该方法平均准确率相对提升了4.41%,在12个任务的跨领域测试中,平均准确率也相对提升了5.33%,无论是针对域内数据的效果还是跨域的稳定性,都达到了该领域的SOTA(State-of-the-Art,最优的)效果。(罗宁)
12月9日,中共中央政治局召开会议,分析研究2025年经济工作。会议指出,“实施更加积极的财政政策和适度宽松的货币政策,充实完善政策工具箱”。...
11月2...
截至美国当地时间11月3日,美国已有超7500万人进行了提前投票,有九个州报告超过50%合格选民已经投票。 佛罗里达大学政治学教授Michael McDonald表示,根据提前投票预...
4月17日,低空经济板块盘中异动拉升,截至发稿,苏交科、万安科技、一博科技等8股涨停,建新股份、金盾股份、商络电子等多股跟涨。 &...