AI项目与工具

Cofounder

Cofounder是一款基于生成式AI技术的开源全栈开发工具,可依据单一提示生成完整的Web应用程序,涵盖后端、前端、数据库及API。其特色包括AI辅助原型设计、模块化设计系统和生成式UI,旨在简化开发流程并提升效率。适用于快速原型开发、敏捷开发、教育领域及企业数字化转型等多种场景。

AnimateAnything

AnimateAnything是一项由浙江大学与北京航空航天大学联合研发的统一可控视频生成技术。它能够根据相机轨迹、文本提示及用户动作注释等多样化控制信号生成高质量视频,并通过多尺度特征融合网络将这些信号转化为逐帧光流进行精准引导。此外,为解决大范围运动带来的视频闪烁问题,该技术采用了基于频率的稳定模块,显著增强了视频的时间稳定性。主要应用于影视制作、虚拟现实、游戏开发以及教育培训等多个领域。

Aisou.ai

Aisou.ai是一款基于大语言模型和检索增强生成技术的智能问答平台,专注于商业信息的高效查询与分析。它支持自然语言提问,提供精准的商业数据分析、实时资讯、竞争对手研究及市场趋势对比等功能,适用于市场分析、投资决策和企业信息查询等多种应用场景。

HumanOmni

HumanOmni 是一款面向人类中心场景的多模态大模型,融合视觉与听觉信息,具备情感识别、面部描述、语音理解等功能。基于大量视频与指令数据训练,采用动态权重调整机制,支持多模态交互与场景理解。适用于影视分析、教育、广告及内容创作等领域,具备良好的可扩展性和灵活性。

ScreenAI

ScreenAI是一款专为理解和处理用户界面(UI)及信息图表而设计的AI视觉语言模型。它能够识别和理解UI元素及其相互关系,并生成与屏幕UI元素相关的文本,如问题回答、UI导航指令和内容摘要。ScreenAI通过多模态编码器结合视觉和语言信息,并采用自回归解码器生成自然语言响应。此外,ScreenAI还能适应不同屏幕格式,提供精确的UI导航和内容摘要功能。

Mistral Large

Mistral Large是Mistral AI开发的一款先进的大型语言模型,具备出色的多语言推理能力和强大的上下文理解能力。它在多个基准测试中表现出色,尤其是在多语言处理、推理和知识、数学与编程方面。Mistral Large支持多语言处理,并且能精确遵循指令,还支持函数调用,便于与开发者工具集集成。此外,该模型可通过Azure AI Studio和Azure Machine Learning平

AsrTools

AsrTools是一款无需复杂配置的智能语音转文字工具,支持多种音频格式的转换,生成SRT和TXT字幕文件,适用于视频字幕、会议记录、音频转写等多个场景。它具有友好的用户界面、高效的多线程处理能力以及详细的技术文档,旨在为用户提供便捷、准确的语音转文字解决方案。

amis

amis 是百度开源的低代码前端框架,通过 JSON 配置快速生成后台页面,支持表单、表格、图表、CRUD 等功能。提供可视化编辑器、主题自定义、国际化和权限管理等企业级特性,兼容 React 和 HTML 项目,适用于后台系统、数据可视化、原型设计等多种场景,显著提升开发效率。

Company Research Agent

Company Research Agent是一款基于多智能体框架的公司研究工具,支持一键生成全面的公司研究报告。它从公司网站、新闻文章、财务报告和行业分析等多源数据中收集信息,并利用Gemini 2.0 Flash和GPT-4.1-mini模型进行高语境研究综合与精确报告格式化。该工具具备AI内容过滤功能,确保信息的相关性和准确性,并通过WebSocket实现实时进度更新,提升研究效率和用户体验

Translate Image

Translate Image 是一款基于 AI 技术的图片翻译工具,支持多语言翻译、上下文感知、技术术语识别等功能。可处理产品图片、电商列表、漫画、照片等,适用于电商、社交媒体和文档处理等多种场景。支持多种图片格式,提供智能文字移除与文本保护功能,翻译准确率高,操作便捷。