2 min read

{on-going}大模型工具观察

{on-going}大模型工具观察
湖州 Photo by William Wang / Unsplash

因为每天都会看到一些产品,有些产品希望能记录下来,供自己备用也供他人参考。重点关注{SOTA}这个评价,代表KG试用且被惊艳到。

  • 通用Agent(2025年的主航道)
    • manus:没说的,确实好用。前同事作品,与有荣焉。
  • 设计
  • 翻译
    • {SOTA}沉浸式翻译:PDF翻译+无损格式 by 推文科技
      • 翻译插件好用,babeldoc可以在不改变排版的情况下翻译pdf,惊艳。
      • 最早是独立开发者@owenyoung开发的,后来被收购。这名字起的极其直白,远胜这帮给大模型命名的...
  • TTS语音生成
    • {SOTA} Speech-02 by miniMax
      • 评测 by orange.ai,里面提到小宇宙会用来做译版podcast的声音服务,希望微信读书&公众号的语音可以替换成水平。
  • 图像
  • 视频
    • {SOTA} HeyGen by 诗云科技
      • 两个场景:一张照片直接讲话,或直接变化一个视频中人物的讲话内容,lipsync非常自然
  • 信息总结
  • Coding
    • Deepwiki by Devin:把github仓库URL中的github替换为deepwiki,自动生成大模型总结。
      • 譬如open webUI,配合沉浸式翻译,不会代码的人也看得懂代码库逻辑。
      • Devin作为第一个通用agent服务,看来对github研究了不少。这个能力上线后,很快OpenAI让deep research链接了github,不知道是否与此有关。
    • gitdiagram:类似 Deepwiki,只是把github资源替换为一个结构图。