AI

Argil

Argil是一款基于SOTA深度学习技术的AI视频生成平台,支持快速创建个性化AI克隆形象,适用于品牌推广、教育、娱乐等多种场景。平台提供丰富的虚拟形象和灵活的视频编辑功能,如机位控制、肢体语言调整等,提升视频吸引力与真实性。无代码操作简化创作流程,支持多语言及多平台适配,适合个人创作者与企业使用。

J1 Assistant

J1 Assistant 是一款基于安卓平台的 AI 智能助手,支持语音输入与多任务处理。用户可通过语音转换为文本,发送至搜索引擎、AI 模型或创建备忘录。支持任务管理、信息查询及智能对话,适用于日常事务管理、学习研究和生活辅助。目前为 Beta 版本,仅限海外用户使用。

海豚AI配音

海豚AI配音是一款支持多语言、多音色的文本转语音工具,提供超过500种真人音色和1000多种二次元音色,适用于有声书、自媒体、教育、动漫及广告等领域。支持多人配音、声音克隆、变声等功能,操作简便,适合各类内容创作者提升作品质量。

Replay

Replay是一款基于AI技术的音频处理工具,可精准分离音乐中的主唱、人声和伴奏等音轨。支持多种音频格式,具备高质量输出、实时预览、参数调整和自动化处理等功能,适用于音乐制作、KTV伴奏、教学及内容创作等领域。操作简便,兼容多平台,为音乐创作和分析提供高效解决方案。

GeneralDyG

GeneralDyG是一种由南洋理工大学提出的通用动态图异常检测方法,适用于社交网络、电商、网络安全和金融等领域。该工具通过时间 ego-graph 采样、图神经网络和时间感知 Transformer 模块,有效捕捉动态图的多尺度特征,具备高适应性和计算效率。实验证明其性能优于多种主流方法,具有广泛的应用前景。

FlexRAG

FlexRAG 是一个高效的检索增强生成(RAG)框架,通过压缩编码器和选择性压缩机制优化长上下文处理,提升计算效率与生成质量。支持多模态数据、多种检索器和多数据类型,适用于开放域问答、对话系统、文档摘要等知识密集型任务,具备灵活配置和可扩展性。

CodeElo

CodeElo 是一款基于 Elo 评级系统的编程能力评估工具,用于衡量大型语言模型在编程竞赛中的表现。它从 CodeForces 平台选取题目,按难度和算法分类,并通过直接提交代码进行测试,确保评估的准确性。该工具可比较模型与人类程序员的水平,适用于模型优化、教学辅助及开发应用,为 LLMs 编程能力研究提供可靠参考。

LLM2LLM

LLM2LLM是一种基于教师-学生架构的迭代数据增强方法,通过生成针对性的合成数据提升语言模型在低数据量场景下的性能。该技术通过识别并强化模型预测错误的数据点,实现精准优化,同时控制数据质量和规模。适用于医学、法律、教育等数据稀缺领域,具有良好的可扩展性和实用性。

Ondoku

Ondoku 是一款支持多语言的文字转语音工具,提供文本输入、图片文字提取及语音调整功能。用户可将文本或图片中的文字转换为自然语音,并下载为音频文件。适用于教育、娱乐、商务等多种场景,如课程讲解、有声书制作和视频配音,提升信息传播效率。

RLCM

RLCM是由康奈尔大学开发的一种基于强化学习的文本到图像生成框架,通过微调一致性模型以适应特定任务的奖励函数,显著提升生成效率与图像质量。其核心技术包括强化学习、策略梯度优化及任务导向的奖励机制,适用于艺术创作、数据集扩展、图像修复等多个领域,具有高效的推理能力和对复杂任务的适应性。