AI项目与工具

CrowdCore

CrowdCore是一款基于AI的网红营销工具,帮助品牌高效筛选并联系全球社交平台上的合适网红。其核心功能包括AI驱动的精准搜索、自动化沟通、数据分析与效果追踪。支持多平台操作,提供超过20个筛选维度,智能优化沟通策略,提升转化率。适用于品牌推广、电商带货、市场调研等多种场景,助力企业实现精准营销与风险控制。

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型,能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型(LRM)设计,采用先进的图像编码、三平面NeRF表示及优化训练策略,支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域,具有高效、高精度和广泛适用性的特点。

Oliva

Oliva 是一款基于语音驱动的 RAG 助手,结合 Langchain 和 Qdrant 向量数据库,实现语音指令到结构化数据的实时响应。支持多智能体协作、语义搜索与灵活知识库集成,适用于企业知识库、智能客服、智能家居等多种场景。具备语音识别、实时通信和自然语言处理能力,提升信息获取与交互效率。

HumanOmni

HumanOmni 是一款面向人类中心场景的多模态大模型,融合视觉与听觉信息,具备情感识别、面部描述、语音理解等功能。基于大量视频与指令数据训练,采用动态权重调整机制,支持多模态交互与场景理解。适用于影视分析、教育、广告及内容创作等领域,具备良好的可扩展性和灵活性。

TITAN

TITAN是一款由哈佛医学院研究团队开发的多模态全切片病理基础模型,通过视觉自监督学习和视觉-语言对齐预训练,能够在无需微调或临床标签的情况下提取通用切片表示并生成病理报告。它在多种临床任务中表现出色,包括线性探测、少样本和零样本分类、罕见癌症检索、跨模态检索和病理报告生成,尤其适用于资源有限的临床场景。

YouTube Dubbing

YouTube Dubbing是一款利用AI技术实现跨语言视频观看的浏览器插件。它通过智能同步配音和字幕翻译功能,帮助用户轻松克服语言障碍,提升视频观看体验。支持多语言、多平台操作,提供多种语音风格和高级功能如倍速播放、背景音保留等,适合语言学习、国际教育、商务会议等多种应用场景。

CodeCV

CodeCV是一款面向互联网从业者的在线简历制作工具,支持Markdown和所见即所得编辑模式。它提供多种免费模板,并具备AI辅助功能,如简历润色和中英互译。用户可自由选择模板并专注内容创作,系统自动完成排版和分页,支持多格式导出,广泛应用于个人求职、职业发展、学生实习、自由职业和跨区域求职等场景。

VoiceCanvas

VoiceCanvas 是一款开源的多语言语音合成平台,基于 AI 技术提供高质量文字转语音服务,支持超过 50 种语言。用户可通过上传简短音频实现个性化声音克隆,并集成多种语音服务以保障输出质量。平台适用于内容创作、教育、企业及个人等多种场景,提升语音内容制作效率。

Kodezi

Kodezi 是一款面向开发者的 AI 工具平台,基于命令行界面(CLI)提供代码自动调试、优化、语言转换、文档生成及自然语言驱动的代码生成等功能。它支持 30 种编程语言,可生成 OpenAPI 规范并托管 Swagger UI 站点,旨在提升代码质量和开发效率,同时优化团队协作与 API 开发体验。

Spring.new

Spring.new 是一款低代码/无代码 AI 开发平台,允许用户通过自然语言创建和部署定制化应用,无需编程。支持多工具集成,具备实时调整功能,并兼容多种 AI 模型,适用于营销、反馈管理及轻量级 CRM 构建等多种场景。