12月25日上午消息,日前,计算机国际声学、语音与信号处理会议ICASSP 2025公布论文录用名单,由巨人网络AI实验室与浙江大学合作的语音研究成果入选ICASSP 2025。该成果提出了一种精准提升音频语言模型性能的创新方法,在实验结果中达到该领域最优效果。

据悉,国际声学、语音与信号处理会议 (International Conference on Acoustics, Speech and Signal Processing, 简称ICASSP) 是全世界最大、最全面的信号处理及其应用方面的顶级会议。作为国际电子技术与信息科学工程师协会 (Institute of Electrical and Electronics Engineers,简称IEEE) 的重要会议之一,在国际上享有盛誉并具有广泛的学术影响力。
巨人网络AI实验室与浙江大学研究团队在合作论文《Multiple Consistency-guided Test-Time Adaptation for Contrastive Audio-Language Models with Unlabeled Audio》中,提出了一种无需标注标签的多重引导提示学习方法,提升了音频分类零样本学习上的效果,为后续在视频配音(Video-to-Audio,V2A)任务上提供精准支持。
根据实验结果,与最先进的模型相比,该方法平均准确率相对提升了4.41%,在12个任务的跨领域测试中,平均准确率也相对提升了5.33%,无论是针对域内数据的效果还是跨域的稳定性,都达到了该领域的SOTA(State-of-the-Art,最优的)效果。(罗宁)
任何一个行业,都难免要在时代的浪潮中几经浮沉,有过低迷不振,也有过巅峰时刻,企业身处其中,一路走来,势必也是玫瑰伴生荆棘,坦途暗藏泥泞。...
自“并购六条”发布以来,上市公司重大重组案例接连出现,“硬科技”并购活力迸发;今年境内新上市公司中,科创板、创业板、北交所公司募资合计占比超六...
7月11日下午消息,今日举办的2024中国科技青年论坛上,中国科学院院士、上海交通大学校长丁奎岭在谈及人工智能发展时表示,以人工智能为代表的科技变革引发了广泛的社会讨论,现在是否会变...
截至2月21日20时,COMEX黄金期货主力合约报价徘徊在2950.6美元/盎司附近,隔夜盘中一度创下历史新高2973.4美元/盎司。随着金价...