生成

Kodezi

Kodezi 是一款面向开发者的 AI 工具平台,基于命令行界面(CLI)提供代码自动调试、优化、语言转换、文档生成及自然语言驱动的代码生成等功能。它支持 30 种编程语言,可生成 OpenAPI 规范并托管 Swagger UI 站点,旨在提升代码质量和开发效率,同时优化团队协作与 API 开发体验。

Woxo

Woxo是一款基于人工智能的视频生成工具,专为社交媒体内容创作者设计。它通过AI技术将文本或概念转化为高质量视频,提供内容创意、快速编辑及定时发布等功能,支持多种社交媒体平台,显著提升视频制作效率。其多平台兼容性和批量创作能力使其成为高效内容生产的理想选择。

Colorify Rocks

Colorify Rocks是一款利用AI技术生成个性化颜色组合的在线工具,可依据用户输入的关键词或主题快速产出协调美观的颜色方案,广泛应用于平面设计、网页设计、品牌策划及室内装饰等领域,同时提供丰富的颜色属性信息以启发用户创意。

Chibi Kohaku

一款AI漫画GPT,以迷人的猫耳女仆的身份分享自拍照或贴纸参与日常对话。

Mini

Mini-Omni 是一个开源的端到端语音对话模型,具备实时语音输入和输出的能力,能在对话中实现“边思考边说话”的功能。模型设计无需额外的自动语音识别(ASR)或文本到语音(TTS)系统,直接进行语音到语音的对话。Mini-Omni 采用文本指导的语音生成方法,通过批量并行策略提高性能,同时保持了原始模型的语言能力。它支持实时语音交互、文本和语音并行生成、跨模态理解等功能,适用于智能助手、客户服务

CogVideoX v1.5

CogVideoX v1.5是一款由智谱研发的开源AI视频生成工具,具备文本到视频生成、图像到视频转换等功能,支持高清视频输出及音效匹配。它通过三维变分自编码器(3D VAE)、Transformer架构等技术手段,提升了视频生成的质量与效率,适用于内容创作、广告营销、教育培训等多个领域。

Sourcetable

Sourcetable 是一款基于AI的电子表格与数据分析工具,支持数据清理、公式生成、图表创建、实时同步及自然语言交互。具备超过500种公式支持,可自动生成SQL查询与数据报告,适用于财务、市场、科研等多场景,提升数据处理效率与协作能力。

MESH·Y

Mesh·Y 是一款由全栈设计师 Anup Aglawe 创作的在线工具,专注于生成美丽多彩的网格渐变。用户无需注册即可使用,支持自定义颜色和尺寸,提供多种渐变

ARTalk

ARTalk是由东京大学与日本理化学研究所联合开发的语音驱动3D头部动画生成框架,基于自回归模型实现实时、高同步性的唇部动作和自然表情生成。它通过多尺度运动码本和滑动时间窗口技术提升动画质量,并引入风格编码器实现个性化风格适配。该工具在唇部同步、表情自然性和风格一致性方面优于现有技术,适用于虚拟现实、游戏开发、动画制作及人机交互等领域。

VidTok

VidTok(Video Tokenizer)是一款由微软开发的开源视频处理工具,通过高效的算法将视频内容转化为“视频词”,支持连续与离散分词化,具有灵活的压缩率和多样的隐空间,适用于视频生成、内容建模及数据压缩等场景。其混合模型架构结合卷积与采样模块,辅以有限标量量化技术,实现了高质量视频重建与高效数据处理。