跳至正文

已支持图片 AI 自动分类打标签,并提供语义搜索

Docker 预览版已发布,点此试用

效果

  • 软件是纯本地运行的(Windows 桌面程序、Docker 容器)
  • 把文件夹添加到软件里,就会通过 AI 给图片自动打标签,并生成索引
  • 文件夹可以是本地硬盘,也可以 NAS 网络共享
  • 添加图片文件夹到索引,开启图片标签分类(基于AI)
  • 等待索引完成
  • 然后,就可以语义化搜索了
  • 输入关键词,并选择搜索类型为“图片标签”,进行搜索

备注

  • 暂时只支持图片
  • 对于视频,理论上也能支持(定时比如5分钟从视频抽帧,然后当作图片处理,然后把N张图片的结果聚合一下),如果你需要,可以留言,需要的人多,我考虑做
  • 目前还不能识别全部类型的图片,如果有更多识别需求,可以留言

问与答:

软件的资源消耗?需要多少算力? 没有显卡,CPU 能不能跑?

  • CPU 也能跑。

  • 内存在首次生成索引期间需要4G~6G内存。

  • 索引完成后,因为模型暂时会一直缓存在内存占用1.6G左右,不过可以优化,闲置状态下释放模型缓存,这样闲置状态- 内存就降低到了300MB左右

  • 想第一时间试用的,可以加我微信

标签多了,是否会导致很多噪音,搜索结果不好?能否把匹配度高的标签排在更前面?

  • 软件的搜索效果很好,标签是带相关度的,程序在生成索引的时候会根据相关度做处理,这样搜索的时候,也会优先匹配相关度高的标签。

AI 是纯本地运算的么?

  • 是的,纯本地运算,软件可以离线运行。

数据量大了后的搜索速度?

  • 软件有索引机制,仅首次生成索引的时候需要做大量计算,后续除非文件更改否则不用再计算,所以第一次添加文件夹后,需要等待索引完毕。
  • 生成完索引后,即使数据量大,搜索的速度也是有保障的。

关于 OCR

  • 可以OCR提取图片文字、扫描版PDF的文字,这也是在生成索引期间做的之后,就可以搜索内容了
  • 暂不支持给扫描版PDF里的图片打标签。

关于文件名+文件内容搜索和分类

  • 文件名可以分词搜索,也可以语义搜索(目前仅限添加了图片标签索引的文件名)

如果能支持管理功能就好了。

  • 暂时还只能提供基础的自动打标签、搜索,先把搜索的结果做准,这是软件的核心
  • 之后再做周边功能,如果软件能持续做下去,文件管理、图片管理功能也会慢慢跟上。

能不能按照人物进行分类分组啊 我这边有一堆需要按作者或者公司分类的

  • 目前不支持,不过现在呼声较多的几个功能:
    图片查重
    视频搜索
    公众角色识别
    人脸识别
    txt标签和搜索
    看发布后,接下来做哪一个吧。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注