首页 » AI前沿资讯 » AI国外资讯 » 正文

SignLLM：全球首个多语种手语生成大模型附项目地址

2024-05-29

在人工智能领域，一项突破性的技术——SignLLM，为全球的听障人士提供了一种全新的沟通桥梁。SignLLM，作为首个多语种手语生成模型，能够将文本或语音提示转化为生动的手语视频，这一创新不仅为听障社群带来了便利，也为信息的无障碍传播开辟了新天地。

SignLLM的核心优势在于其对首个多语言手语数据集Prompt2Sign的构建和应用。该数据集汇集了来自世界各地的手语视频，通过精心的处理和标注，转化为易于机器学习模型训练的格式。这一举措极大地优化了seq2seq和text2text等翻译模型的训练过程，为SignLLM的高效性能打下了坚实的基础。

Signllm：全球首个多语种手语生成大模型附项目地址

SignLLM的技术框架包含两个关键的创新模块：

矢量量化视觉符号模块：这一模块负责将手语视频转化为一系列离散的字符级符号标记，为后续的处理和翻译提供了基础。
代码本重建和对齐模块：该模块将字符级标记转换为单词级，通过最佳传输公式进行符号表示，并通过符号-文本对齐损失进一步强化了符号和文本标记之间的语义兼容性。

在两个广泛使用的手语翻译（SLT）基准测试中，SignLLM展现了其卓越的性能，取得了最先进的无光泽结果。这标志着SignLLM在手语翻译技术方面的领先地位。

Signllm：全球首个多语种手语生成大模型附项目地址

SignLLM的诞生，得益于大型语言模型（LLMs）的强大翻译能力。研究团队通过对手语视频的规范化处理，使得现成的LLMs能够更好地理解和生成手语，极大地提高了手语视频的可读性和实用性。

随着技术的不断进步和应用的深入，SignLLM有望在全球范围内为听障人士提供更加便捷、高效的沟通方式。它不仅能够促进信息的无障碍传播，还将在推动社会包容和平等方面发挥重要作用。

SignLLM GitHub入口地址：https://www.yumiok.com/aitools/sites/1939.html

Signllm：全球首个多语种手语生成大模型附项目地址

AD：精心整理了2000+好用的AI工具！点此获取

标签：SignLLM · 人工智能 · 多语种支持 · 手语翻译 · 数据集创新 · 辅助技术

免费AI工具合集，点击进入

AI对话

玉米AI助手