ParGo ParGo是一种由字节与中山大学联合开发的多模态大语言模型连接器,通过结合局部与全局token,提升视觉与语言模态的对齐效果。其核心模块PGP和CPP分别提取图像的局部和全局信息,增强细节感知能力。在多个基准测试中表现优异,尤其在文字识别和图像描述任务中优势明显。采用自监督学习策略,提高模型泛化能力,适用于视觉问答、图像字幕生成、跨模态检索等多种场景。 AI项目与工具 2025年06月12日 38 点赞 0 评论 698 浏览
Aqua Voice Aqua Voice 是一款AI驱动的语音转录与文档编辑工具,支持语音转文字、自然语言指令编辑、自动格式优化及多语言处理。它适用于高效写作、辅助输入及跨平台办公场景,兼容多种主流应用,提升文本创作效率与准确性。 AI项目与工具 2025年06月11日 81 点赞 0 评论 698 浏览
智谱清言 智谱清言AI助手基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2,经过万亿字符的文本与代码预训练,并采用有监督微调技术,以通用对话的形式为用户提供智能化服务。 Ai办公效率 2025年06月05日 25 点赞 0 评论 698 浏览
冒泡鸭 借助自研的多模态大模型技术,冒泡鸭成为对话AI的新代表。这个先进的系统植入了众多由大模型技术支持的智能对话单元,这些“智能体”旨在提供用户所需的信息和灵感,不仅解答疑问,... 创作工具 1970年01月01日 0 点赞 0 评论 698 浏览
办公小浣熊 商汤科技推出的办公小浣熊是一款先进的数据分析工具,它依托于商汤科技独立研发的大型语言模型,致力于帮助用户执行数据分析与可视化展现,而无需用户具备编程技能或执行繁琐的操作。 创作工具 1970年01月01日 0 点赞 0 评论 698 浏览
创视元数字人 创视元通过其简单易用的界面和先进的AI技术,使得数字人视频创作变得快速、便捷。无论是企业宣传、教育培训还是其他应用场景,创视元都能提供高效的解决方案。 创作工具 1970年01月01日 0 点赞 0 评论 698 浏览