学习

Kimi Latest

Kimi Latest是月之暗面推出的实时更新AI模型,支持128k上下文长度,可自动选择模型规模并优化成本。具备图像理解、自动上下文缓存和多模态处理能力,适用于聊天应用、内容创作及数据分析等多种场景,为开发者和用户提供稳定高效的AI解决方案。

AIGCPanel

AIGCPanel是一款开源的AI数字人系统,支持视频合成、声音合成与声音克隆等功能。它利用自然语言处理、计算机视觉技术和深度学习算法,实现高质量的音视频同步和自然语音生成。系统具有多语言支持、模型管理和日志查看功能,可应用于影视制作、虚拟主播、教育培训等多个领域。

EvolveDirector

EvolveDirector是一个由阿里巴巴与南洋理工大学合作开发的文本到图像生成框架,通过与高级模型API交互获取数据对,结合预训练的视觉语言模型(VLMs)动态优化训练集,大幅降低数据量和训练成本。该框架支持多模型学习、动态数据集管理及在线训练,显著提升了生成图像的质量和多样性,广泛应用于内容创作、媒体娱乐、广告营销、教育科研等多个领域。

UltraMem

UltraMem是字节跳动推出的超稀疏模型架构,通过优化内存访问和计算效率,显著降低推理成本并提升速度。其核心技术包括多层结构改进、TDQKR和IVE,使模型在保持性能的同时具备更强的扩展性。适用于实时推理、大规模模型部署及多个行业场景。

Midjourney V7

Midjourney V7 是一款基于深度学习的 AI 图像生成工具,具备草稿模式、语音交互、实时编辑等功能,显著提升生成速度与图像质量。其支持个性化配置,可根据用户偏好优化输出结果,适用于艺术、设计、娱乐等多个领域。系统采用先进神经网络技术,实现文本到图像的精准转换,并提供多种运行模式以满足不同需求。

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架,支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制,提升文本提示对目标区域的控制能力,确保时间一致性与特征分离,显著优于现有T2I和T2V方法。该工具无需额外参数调整,具备高效计算性能,适用于影视制作、广告营销、内容创作等多个领域。

MatterGen

MatterGen是由微软开发的生成式AI模型,专注于无机材料的设计与生成。它通过扩散过程逐步优化原子结构,生成稳定、多样化且符合特定性能要求的材料。支持化学组成、磁性、电子和机械性能等多维度约束,适用于逆向材料设计,提升新材料研发效率。已应用于能源、催化、电子等领域,推动材料科学进步。

Saner.AI

Saner.AI是一款以人工智能驱动的知识管理工具,旨在提高个人和团队的工作效率。其主要功能包括即时笔记记录、智能信息导入、专注模式、多视角信息查找、PDF与笔记摘要生成,以及标签推荐和相似笔记连接等。通过这些功能,Saner.AI能够帮助用户高效整理信息、激发创意,并提升专注力。它适用于多种场景,包括个人知识管理、团队协作、学习辅助、项目管理和日常任务规划,同时注重数据安全与隐私保护。

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型,通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作,如放大区域或选择帧,以捕捉细节。采用两阶段训练方法,结合指令调优和好奇心驱动的强化学习,提升视觉推理性能。在多个基准测试中表现优异,适用于视觉问答、视频理解等任务,广泛应用于科研、教育、工业质检和内容创作等领域。

Yuxi

Yuxi-Know是一款基于RAG和知识图谱技术的智能问答平台,支持多种文档格式上传与向量化存储,可高效检索并生成准确答案。集成Neo4j知识图谱,支持复杂关系查询,兼容多模型平台及本地部署。提供智能体拓展、网页检索和可视化配置功能,适用于企业知识管理、教育、客服、医疗及科研等领域,提升信息处理效率与准确性。