模型

智谱清言ChatGLM

智谱清言是一款基于人工智能技术的对话助手,遵循中国政府的立场和社会主义价值观,提供多领域知识问答、信息检索、文本生成等服务。

Browser Use

Browser Use是一款基于大语言模型的智能浏览器工具,支持多标签页管理和视觉识别,可提取网页内容并记录操作步骤。它允许开发者自定义动作,如保存文件或推送至数据库,并兼容多种主流LLM模型,具备并行运行和自我修正能力,旨在提升任务执行效率与准确性。

EyeDiff

EyeDiff是一款基于扩散模型的文本到图像生成工具,专为多模态眼科图像生成设计。通过自然语言提示,EyeDiff能够捕捉常见及罕见眼病的关键特征,显著提升诊断准确性。该工具采用CLIP文本编码器与交叉注意力机制,结合潜在扩散模型(LDM),生成高质量、与文本高度一致的图像,适用于数据增强、疾病筛查、数据共享及医学教育等场景。

Sonauto AI

一款AI音乐生成器,允许用户通过将文本提示、歌词或旋律转换为完整的不同风格的歌曲。它采用了潜在扩散模型,这使得它与其他人工智能音乐生成模型相比更加可控。

Phantom

Phantom是由字节跳动研发的视频生成框架,支持从参考图像中提取主体并生成符合文本描述的视频内容。它采用跨模态对齐技术,结合文本和图像提示,实现高质量、主体一致的视频生成。支持多主体交互、身份保留等功能,适用于虚拟试穿、数字人生成、广告制作等多种场景。模型基于文本-图像-视频三元组数据训练,具备强大的跨模态理解和生成能力。

云锦天章

云锦天章是一款基于DCFormer架构的通用大模型,能够高效地进行文字扩写、缩写和风格变换,具备问答、数学、编程等基础能力。它通过动态组合多头注意力机制,大幅提升模型效率并降低能耗,适用于小说创作、教育辅导、内容生成、企业服务及娱乐等多个领域。

The AI Scientist

The AI Scientist-v2 是一个端到端的 AI 系统,能够自主完成从提出科学假设到撰写论文的全流程科研任务。它采用基于代理的树搜索方法,提高科学探索效率,并结合视觉-语言模型优化内容质量。该系统已成功生成并通过同行评审的 AI 论文,标志着 AI 在科学研究领域的重大突破。适用于科研自动化、机器学习、跨学科研究及教育等多个场景。

HiveChat

HiveChat 是一款面向中小团队的 AI 聊天工具,支持多款主流 AI 模型,具备文本交互、图像理解、LaTeX/Markdown 渲染等功能。系统基于 React 构建,支持多种部署方式,适用于企业沟通、学术研究、内容创作等场景,提供高效、便捷的智能协作体验。