效果
- 软件是纯本地运行的(Windows 桌面程序、Docker 容器)
- 把文件夹添加到软件里,就会通过 AI 给图片自动打标签,并生成索引
- 文件夹可以是本地硬盘,也可以 NAS 网络共享
- 添加图片文件夹到索引,开启
图片标签分类(基于AI)
- 等待索引完成
- 然后,就可以语义化搜索了
- 输入关键词,并选择搜索类型为“图片标签”,进行搜索
备注
- 暂时只支持图片
- 对于视频,理论上也能支持(定时比如5分钟从视频抽帧,然后当作图片处理,然后把N张图片的结果聚合一下),如果你需要,可以留言,需要的人多,我考虑做
- 目前还不能识别全部类型的图片,如果有更多识别需求,可以留言
问与答:
软件的资源消耗?需要多少算力? 没有显卡,CPU 能不能跑?
CPU 也能跑。
内存在首次生成索引期间需要4G~6G内存。
索引完成后,因为模型暂时会一直缓存在内存占用1.6G左右,不过可以优化,闲置状态下释放模型缓存,这样闲置状态- 内存就降低到了300MB左右
想第一时间试用的,可以加我微信
标签多了,是否会导致很多噪音,搜索结果不好?能否把匹配度高的标签排在更前面?
- 软件的搜索效果很好,标签是带相关度的,程序在生成索引的时候会根据相关度做处理,这样搜索的时候,也会优先匹配相关度高的标签。
AI 是纯本地运算的么?
- 是的,纯本地运算,软件可以离线运行。
数据量大了后的搜索速度?
- 软件有索引机制,仅首次生成索引的时候需要做大量计算,后续除非文件更改否则不用再计算,所以第一次添加文件夹后,需要等待索引完毕。
- 生成完索引后,即使数据量大,搜索的速度也是有保障的。
关于 OCR
- 可以OCR提取图片文字、扫描版PDF的文字,这也是在生成索引期间做的之后,就可以搜索内容了
- 暂不支持给扫描版PDF里的图片打标签。
关于文件名+文件内容搜索和分类
- 文件名可以分词搜索,也可以语义搜索(目前仅限添加了图片标签索引的文件名)
如果能支持管理功能就好了。
- 暂时还只能提供基础的自动打标签、搜索,先把搜索的结果做准,这是软件的核心
- 之后再做周边功能,如果软件能持续做下去,文件管理、图片管理功能也会慢慢跟上。
能不能按照人物进行分类分组啊 我这边有一堆需要按作者或者公司分类的
- 目前不支持,不过现在呼声较多的几个功能:
图片查重
视频搜索
公众角色识别
人脸识别
txt标签和搜索
看发布后,接下来做哪一个吧。