AI项目与工具

Diffusion Self

Diffusion Self-Distillation (DSD) 是一种基于预训练文本到图像扩散模型的零样本定制图像生成技术,通过自动生成数据集并微调模型,支持文本条件下的图像到图像转换任务。其核心在于利用生成图像网格与视觉语言模型筛选高质量配对数据集,实现无需人工干预的身份保持定制化图像生成。该技术广泛应用于艺术创作、游戏开发、影视制作、广告营销及个性化商品等领域。

Rizzle

Rizzle 是一款人工智能视频创作平台,能够将文本、播客和音频内容快速转化为具有专业外观的视频。平台通过与 Getty Images 的合作,提供了超过 5 亿张图片和视频的媒体资源库,使用户能够自定义文本样式、画面比例、背景音乐等元素。其主要功能包括缩略图制作、文本高亮剪辑、地图生成、无面孔视频等,简化了视频制作流程,适用于社交媒体营销、内容创作、教育、产品演示、新闻报道及企业内部沟通等多种应

LongAlign

LongAlign是一种针对文本到图像生成任务的改进方法,通过分段级编码技术和分解偏好优化,有效解决了长文本输入的对齐问题。它能够显著提升生成图像与输入文本的一致性,广泛应用于艺术创作、游戏开发、影视制作及教育等领域,具备高精度和强泛化能力。

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型,基于端到端强化学习实现“用图思考”能力,无需依赖监督微调。它在推理过程中动态调用图像工具,增强对细节的感知与理解,在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能,适用于教育、医疗、交通、安防和工业等多个领域。

Cerebellum

Cerebellum是一款结合Claude 3.5 Sonnet与Selenium WebDriver的智能化浏览器助手,通过构建网页浏览的有向图模型,利用LLM技术分析页面内容和交互元素,智能规划操作路径并动态调整策略。它支持多浏览器操作,可精确模拟用户行为,广泛应用于网页自动化测试、数据抓取、内容管理及电子商务等多个领域。

OpenAI o1模型

OpenAI的最新推理系列AI大模型“Strawberry”,包括“o1-preview”和成本较低的“o1 mini”版本。该模型通过强化学习训练,具备复杂的推理能力和多模态理解能力。它采用了“思维链”机制,增强推理透明度,具备自我纠错功能。在国际数学奥林匹克等基准测试中表现出色,展现出强大的性能。设计时考虑了安全性、可靠性和成本效率。 ---

Endex

Endex是一款面向金融行业的智能平台,基于生成式AI技术提供金融数据分析、文档处理、市场预测、交易策略优化等服务。其核心产品包括Nova自主金融分析师和Forge AI原生编排层,能够提升金融工作的效率和准确性。适用于金融文档分析、风险识别、报告生成、智能客服及财富管理等多个场景,具备高度自动化和智能化能力。

Get笔记

Get笔记是一款基于AI的实时语音转文字工具,能够将语音高效转化为文本,并提供文本润色服务以优化笔记内容。其主要功能包括实时语音转写、文本智能润色、自动标题生成和录音与文本保存。这款工具界面简洁、操作简便,适用于多种场景,如会议记录、学习笔记、采访记录、灵感捕捉和语言学习等,显著提升了记录效率。

Fridge Leftovers AI

Fridge Leftovers AI是一款智能烹饪应用,通过AI技术识别冰箱内食材并推荐个性化食谱,提供分步烹饪指南、营养分析及食材替代建议。它帮助用户减少食物浪费、优化饮食结构,并提升烹饪体验,适用于日常餐饮规划、食材清理及特殊饮食需求等场景。

Aiuni

[Aiuni是一款利用先进AI技术将2D图像转化为高质量3D模型的在线平台。它支持纹理生成、模型优化、动画添加等功能,适用于数字媒体、游戏开发、影视制作等多个行业。其核心技术包括多视图扩散模型和网格重建算法,能快速生成高保真度的3D模型,并具备强大的细节捕捉能力。]