跳至正文

如何自定义分词器的词库字典?(归海数据个人版)

归海数据内置分词字典 通用中文搜索效果准确,大众需求足以满足。仅有特殊需求的用户可能需要自定义词典。

全文搜索效果跟分词的效果关系很大,每个词库和分词器都有他的局限性,对于有特殊需求的用户,偶尔有个别词没有分出来会搜不到。

具有较高电脑经验用户,可使用盘古分词字典编辑器加载归海的分词字典文件新增自定义词语。

字典文件默认路径:

%UserProfile%\AppData\Local\Programs\GuiHaiData\resources\backend\PanGu\Dictionaries
(如果您修改过程序安装路径,则请将上方部分路径替换为您自定义的安装路径)

新增自定义分此后,需要重建索引。

盘古分词字典编辑器下载

《如何自定义分词器的词库字典?(归海数据个人版)》有2个想法

  1. 启动失败
    Http failure response for http://127.0.0.1:5000/Startup/getStartupStatusDetail?!lang=zh-CN: 0 Unknown Error

    {
    “errorInfo”: “检查端口\r\n启动服务\r\n安装服务…\r\n启动服务…\r\n服务启动成功\r\n…\r\n初始化搜索引擎…\r\n搜索引擎初始化出错:Http failure response for http://127.0.0.1:5000/Search/Search?!lang=zh-CN: 0 Unknown Error\r\n”,
    “loaderError”: {
    “error”: {
    “headers”: {
    “normalizedNames”: {},
    “lazyUpdate”: null,
    “headers”: {}
    },
    “status”: 0,
    “statusText”: “Unknown Error”,
    “url”: “http://127.0.0.1:5000/Startup/getStartupStatusDetail?!lang=zh-CN”,
    “ok”: false,
    “name”: “HttpErrorResponse”,
    “message”: “Http failure response for http://127.0.0.1:5000/Startup/getStartupStatusDetail?!lang=zh-CN: 0 Unknown Error”,
    “error”: {
    “isTrusted”: true
    }
    }
    }
    }

    1. 你好,重新开启试过吗?
      任务管理器是否有 TianZen 打头的进程?
      打开任务管理器,切换到服务选项卡,里面有一个叫 GuiHaiData 的服务,点击“启动”或“重启”后,查看任务管理器是否有 TianZen 打头的进程?如果有,退出界面,等一儿再重新打开界面试试?

      如果是 Windows 7 系统

      试试安装要这两个系统组件:
      https://www.microsoft.com/en-us/download/details.aspx?id=52685
      https://support.microsoft.com/zh-cn/help/2533623/microsoft-security-advisory-insecure-library-loading-could-allow-remot

      如果还不行,再安装一下 .NET Core 3.1 试试
      https://dotnet.microsoft.com/download/dotnet-core/3.1

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注