跳至正文

桌面搜索路线图

[ ] 表示进行中或计划中 表示已完成。

  • [] Docker 版本(支持通过 Docker 挂载文件夹进行索引,并提供 web 搜索界面)

  • [] 提供企业局域网内网共享文档搜索引擎(基于 Docker 或 Windows 版程序)

  • [] 提供基于自定义资料库 + 大模型的企业知识库问答机器人 / 智能客服

  • [] 在现有预览模式基础上,增加 AnyText Search / vscode 那样的将文件的所有关键词命中片段以以小列表形式显示,点击快速跳转

  • ☑ 国产系统 UOS、Linux 版本(已发布测试版)

  • ☑ 基于 arm64 的 UOS、Linux 版本(适配中)

  • [] macOS 版本

  • [] 增加 AnyText Search 那样的安装后就自动傻瓜化索引常用文档的模式,不需要用户再手动添加文件夹

  • [] 政府/企业级功能:部门数据权限、多用户机制

  • [ ] 适配文心一言 AI 大模型

  • [ ] 提供更多 AI 大模型应用场景

  • [ ] 提供截图并 OCR 识别为文字,然后通过 AI 大模型(ChatGPT 或文心一言)进行错别字纠正和排版修复。

  • .caj 中国知网文档格式搜索支持(部分支持了)

  • ☑ 搜索筛选器(范围、文档类型) UI 交互优化,更傻瓜化

  • 全新 UI

  • 基于 AI 的产品重构

    • 新增文本向量索引机制,支持语义分析&搜索
    • 基于语义搜索,实现基于用户的所有文档内容,构建私有知识库 AI 问答/聊天机器人
    • 调用大模型 AI (如 ChatGPT)对某个文档进行总结、提问

    语义搜索效果
    为了体现效果,将内容中的某句话“中美究竟是重新破冰好还是走向对立好”翻译为日文“米中は再び氷を割るのがいいのか対立に向かうのがいいのか”后进行搜索:

    如图所示,说明 AI 语义搜索模式下,搜索是基于语义进行相似意义匹配,而不是基于词本身。

  • ☑ 升级 OCR 引擎,大幅提升识别率,手写字、照片、海报、各种角度的文字都能识别 (3.2.3 版已完成)

  • ☑ 支持针对文件夹限定要索引文件扩展名类型 (3.1.7 版已支持)

  • ☑ 对于网络共享磁盘类型的文件夹,支持通过用户名密码连接。并优化对网络共享文件夹的校验和支持 (3.1.6 版已支持)

  • [] macOS 版本 (开发中,主要功能已可用)

  • ☑ OCR 增强:基于 AI 的图片文字识别(OCR),实现高识别率

  • ☑ 傻瓜化自定义索引文件夹文件类型限定(比如限定A文件夹仅索引文档类文件,B文件夹仅索引图片文件)(3.1.8 版已支持)

  • [] uTools 桌面搜索插件

  • 更友好的搜索结果预览,直接在软件内实时预览、翻页,如果有可能还会在实时预览中高亮搜索关键词(如下图)。

    如上图,对于 PDF 支持实时预览,并且能一定程度上高亮搜索关键词。

  • 全新高级搜索:全词匹配搜索、模糊搜索限定模糊字个数、并且、或者 逻辑搜索

  • ☑ 大量功能、准确度优化 & 体验改进的 3.0 版本(开发中:功能完善和 BUG 测试中即将发布测试版

  • ☑ 简化的“无索引”搜索,现有版本已支持“无索引”搜索,但操作不够简化。

  • ☑ 二次搜索和自定义条件搜索(已支持多种复合条件搜索)

  • ☑ 全新界面 UI,更直观和傻瓜化 (3.0 版本之后)

  • ☑ OCR 支持,图片 PDF OCR 支持(3.0 发布后)

  • ☑ PDF 文件预览和预览页面关键词高亮(3.0 发布后)

  • [ ] 多标签搜索,多个不同的搜索可以以多标签形式呈现

  • ☑ 优化了文件搜索结果的高亮和搜索预览,搜索文件内容、代码都可以更准确的高亮(3.0 版本

  • ☑ 文件变更处理优化:在索引完成的情况下,文件的变更会几乎实时的更新(部分文件无法比如 Office 文档往往更新时仍旧被打开,此时文件被占用无法立即更新,也会在之后更新)

  • ☑ 加强了文件夹筛选器的功能,无需添加索引也支持筛选 NTFS 磁盘

  • ☑ 降低了索引过程中界面的 CPU 消耗

  • ☑ 重构文件变更检测、文件处理队列机制,完善定时批量文件变更检测,解决 LMDB 死锁问题

  • ☑ 解决某些用户首次使用软件后台进程 CPU 占用率高的问题(3.0 版本

  • ☑ 优化全文搜索页面提示,有些用户找不到全文搜索的位置

  • ☑ 增加 IFilter 支持,对于归海原本不支持的搜索文件格式,Windows 系统下只需安装对应 IFilter 组件,即可支持索引,如果 IFilter 组件是后期安装的,需要删除并重新建立索引(3.0 版本)。

  • 降低索引磁盘空间占用(2020-10-10)
    归海桌面搜索的索引占用空间一直较高,新版桌面对于 NTFS 搜索专门设计了一个迷你数据库,在降低 60% 磁盘空间占用的同时,实现提升 150% 的写入速度,进而实现首次启动提速 100%。

  • 增加文件夹范围选择,支持限定仅对部分文件夹进行搜索 (2020-07-23)

  • 增加了文件夹范围选择

  • 新增邀请下载延长免费使用 (2020-05-17*)

  • 支持根据文件类型进行筛选 (2020-03-16)

  • 新增高级搜索 (2020-03-16)
    归海数据桌面搜索支持如下高级搜索:

    • 支持限定必须包含、不能包含、与、或等条件
    • 高级查询支持对文件名、路径、文件内容执行查询,支持与、或、非逻辑,支持正则表达式
  • 增加性能模式切换功能 (2020-02-16)

  • 优化可移动硬盘/U盘的支持 (2020-01-11

  • 发布全新架构的 2.0 Beta,优化大量历史版本问题 (2010-01-05)
    优化了历史版本的大量问题,并新增了如下功能:

  • 更灵活的设定索引设置

    • 添加任意文件夹至索引
    • 设定索引级别:仅文件名/全文/实时
    • Windows 系统 NTFS 磁盘可选疾速索引模式。
  • 恢复了文件变更检测(Beta)

  • 可选作为服务启动(为了更高效的文件变更检测,变更检测不用再全盘扫描了)

  • 索引速度比以往更快

  • NTFS 磁盘无索引搜索比以往快 3 倍(1s 以内)

  • 可以自定义索引数据库文件的存放目录

  • ☑ [增加标签云(从数据中自动挖掘并生成),目前版本还比较初级是数据挖掘迈出第一步] (2018-10-30)

  • ☑ [大幅降低了索引生成过程中的 CPU 占用] (2018-10-26)

  • ☑ [写下了归海数据第一行代码] (2018-08-11)

《桌面搜索路线图》有2个想法

  1. 希望可以实现全盘双链,比如文字与视频的某片段可以联动,图片和文字可以联动。等等
    在mac上,双链软件可以把整台电脑系统变成一个笔记软件,比如软件:hookmac。
    如果可以在win上实现这个功能,那么这可以大幅提高win上文本生产力,从而产生更多的知识。

    1. 很有意思的建议,我们考虑考虑,搜了下 hookmac 的资料不多。当前我们主要目标是优化软件体验和增加 AI 相关功能。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注