周末整理硬盘,发现了一个两年前的烂尾软件项目。打开瞄了一眼,完成度大概有6成,然后花了点儿时间完善了一下。
程序的大致结构如下图所示。
操作起来像下面这样。
项目开始于2023年初,当时ChatGPT刚出来没多久,然后就想着利用AI大模型进行文档处理(翻译、润色等),不过当时ChatGPT实在是太烂,指令符合性太差,然后就放弃了,项目文件就一直在硬盘的角落里吃灰。
不过如今AI大模型能力有了翻天覆地的变化,一些本地部署的大模型能力都超过了当初的ChatGPT3.5,再加上现如今大模型API的价格基本上已经处于白菜价了,这项目似乎还有存在的必要。
软件的主要功能包括:
导入文本文件并显示。支持的文件格式包括Markdown、txt、pdf及docx。
支持利用AI大模型对选择的文本进行处理。主要包括兼容OpenAI的API以及本地Ollama部署的大模型。
支持自定义提示词。
启动软件
选择 打开文件夹 或 打开文件。若打开文件夹则会自动加载文件夹下的所有md、txt、pdf及docx扩展名的文件,若打开文件则只能打开单个文件。文件打开后会自动加载并显示。如下图所示为打开了一个markdown文件。
此时可以在软件的状态栏中设置AI大模型及软件操作模式。
设置AI大模型。大模型需要自己在 设置 对话框中添加。
设置软件操作功能。操作功能由提示词决定,可以通过工具按钮 提示词维护 进入相应的对话框进行设置及添加。
设置软件操作模式。目前提供了3种模式:手动、半自动及全自动。对于手动操作,当选择文本后,只是将选择的文本放入待处理窗口;对于半自动操作,当选择文本后,软件会自动按照选择的功能进行处理;对于全自动模式,则当选择文本后,软件会自动按照所选功能进行处理,然后将处理完毕的文本替换到选择的文本上。
软件的设置主要包括提示词设置与基本参数设置。
当点击 提示词维护 按钮后,会自动打开 提示词管理 对话框,如下图所示,在其中输入 提示词名称 及 提示词内容 后即可添加新的提示词,注意 提示词名称 会自动添加到功能列表中。软件预置了一些常用的提示词。
当点击 设置 按钮后会打开 选项 对话框,如下图所示。
其中 显示设置 主要设置一些颜色、字体等参数。
模型设置 中主要用于AI大模型的调用参数,主要是模型名称、API秘钥及API地址,这里推荐使用免费的GLM-4-Flash。可以在智谱平台官网( https://open.bigmodel.cn/console/overview ) 申请API。当然其他所有兼容OpenAI的大模型也是支持的。
软件支持本地部署的Ollama模型,如下面使用的Qwen3:14b。
直接填写模型名称、模型秘钥、API地址、模型别名后即可自动保存模型信息。然后就可以在主窗体的模型选择列表中进行选择了。
建议使用智谱免费的GLM-4-Flash大模型,不过如果肯花钱的话,用GLM-4-Plus或Qwen-turbo也是相当不错的,它们对中文的支持都非常好。下面说一下智谱API的申请流程。入智谱大模型平台:https://www.bigmodel.cn/invite?icode=Q1YUg0QzldhdxRTNMILWaQ%3D%3D
点击 登录/注册 按钮可以登录或注册。第一次注册好像是送2000万token,其实是折算成18块钱,就目前他们家的大模型价格来说,可以用很久了。
注册完毕后可以登录,然后点右上角的人头下方的 个人中心
进入个人中心后点左侧列表中的 项目管理 → API keys ,然后再点右上角的 添加新的API Key 创建API Key
API创建完毕后,可以将API Key复制下来,后面要用
进入软件,点击工具按钮 设置 进入设置对话框
进入到 模型设置 中,在模型参数中如下图所示设置即可
关闭对话框即可自动保存并在主窗口中选择使用了。
软件还有一些功能没有实现,如现在支持PDF和Word文档查看及处理,后期想加个笔记编写功能,这样就可以一边看文献一边记笔记了。不过目前Markdown实时渲染功能还没有眉目,等后面有时间搞定了再说。再比如加入全文翻译、OCR识别等功能,这也要等以后再说了。