AI工具

Omni Reference

Omni Reference 是 Midjourney V7 提供的一项图像生成辅助功能,允许用户将特定人物、物体或场景嵌入生成图像中。通过 `--oref` 和 `--ow` 参数,用户可灵活控制参考图像的权重与风格融合程度,提升创作精度与多样性。支持 Web 和 Discord 两种平台操作,适用于角色嵌入、产品展示、场景构建等多种应用场景。

screenpipe

ScreenPipe是一款基于AI技术的开源软件,具备全天候屏幕和音频记录功能,能够智能生成每日工作摘要、会议纪要,并监控安全风险。它支持本地处理,确保数据安全,同时提供插件系统以满足个性化需求。ScreenPipe适用于个人效率提升、企业自动化、安全监控、内容创作、教育培训及客户服务等多个场景。

HMA

HMA(Heterogeneous Masked Autoregression)是一种基于异构预训练和掩码自回归技术的机器人动作视频建模方法,支持离散与连续生成模式,可处理不同动作空间的异构性。该工具具备高效实时交互能力,广泛应用于视频模拟、策略评估、合成数据生成及模仿学习等领域,适用于机器人学习与控制任务,提升策略泛化与执行效率。

Project Turntable

Project Turntable是一款由Adobe发布的AI工具,支持用户在三维空间中旋转二维矢量图像,并利用生成式AI和深度学习技术即时生成图像的隐藏部分。它显著提升了设计师的工作效率,减少了重复性劳动,适用于平面设计、插画创作、动画制作及游戏开发等领域,同时保持了图像的二维特性和平滑过渡效果。

TECHSPECS

TechSpecs Ray是一款由AI驱动的媒体播放器,主要功能包括实时多语言字幕生成与翻译、智能媒体搜索及分类、主流流媒体平台集成等。它支持上千种媒体格式,可跨多平台运行,致力于消除语言壁垒,提升全球用户的媒体访问体验。

MMaDA

MMaDA(Multimodal Large Diffusion Language Models)是由普林斯顿大学、清华大学、北京大学和字节跳动联合开发的多模态扩散模型,支持跨文本推理、多模态理解和文本到图像生成等多种功能。其采用统一的扩散架构和模态不可知设计,结合混合长链推理微调策略与UniGRPO强化学习算法,提升跨模态任务性能。MMaDA在多项任务中表现优异,适用于内容创作、教育辅助、智能客

Autoppt

Autoppt是一款基于人工智能技术的演示文稿生成工具,能够根据用户输入的主题快速生成结构化、专业级的PPT文稿。其主要功能包括自动化生成、模板选择、数据可视化、动画效果添加、思维导图生成及多格式导出等,支持个性化定制和团队协作,广泛应用于商务演示、教育培训、项目汇报和个人场景中。

DiffSplat

DiffSplat是一款高效的3D生成工具,能够根据文本或图像快速生成高质量的3D高斯点云。它基于预训练的文本到图像扩散模型,结合2D先验知识和3D渲染损失机制,确保生成内容在多视角下保持一致。支持文本、图像或组合输入,具备可控生成能力,适用于3D内容创作、图像重建及多种下游应用。

MatChat AI

MatChat AI是一款面向材料科学领域的AI工具,基于大语言模型和增强搜索技术,整合了大量专业论文知识,构建了权威的知识库。用户可通过自然对话方式获取精准的材料科学信息,并获得可靠的参考文献。该工具专注于材料科学应用,避免通用模型的“幻觉”问题,为科研人员提供高效的知识支持,推动研究智能化发展。

Bolto

Bolto 是一款面向软件工程师招聘的 AI 平台,通过智能简历分析、AI 面试与编码评估,精准筛选合适候选人。平台提供从招聘到入职的全流程服务,包括面试安排、合同管理、薪酬发放及合规支持,有效提升招聘效率。适用于初创企业、全球化团队及定制化招聘需求,实现高效、专业的技术人才获取。