自从有了GPT,尤其是GPT-4 Turbo,就再也没法好好读书了,讲起一本书,就第一时间找PDF,然后丢进GPT里,让它先总结一下要点,列一下每个章节的主要内容,然后再决定是随便翻一下,或是发现值得再仔细追问一下的重点,还是说真的要仔细阅读整本书。
但是,我们常常找到其它格式的书,要转换成PDF才行,这就涉及到各种不同格式文档之间的转换,今天就碰到一个,梅多斯的《系统之美》这本书,只找到了epub版,要怎么转为PDF呢?先是找了一个国外的网页版的转换工具,结果中文有乱码,然后找到了Mac下的calibre这个软件:
这个软件非常好(就是有点大,安装起来接近1个G了),打开文件后,点击“转换书本”的菜单,弹出窗口选择输出格式为 PDF,就能得到一个PDF版的文件。
然后,我丢进ChatGPT里,一问,它居然说我的文件是空的!明明看着正常的啊?于是在PDF Expert 打开仔细看,它是转换成了很多块的这种结构!估计这样导致GPT无法正确读取文字。
怎么办呢,我发现,calibre是能直接把epub转为word格式的!就是在输出格式那里,选择 DOCX,就得到了word文件,这个word文件是转换的非常好的,就是纯粹的文本与图像,格式也保留的很好。于是,再把这个Word文件,另存为PDF!上传到GPT,搞定!!
在Sider这个软件中,读PDF有两种方式,一种是在浏览器的侧边栏中,点击那个带+号的文件夹图标,选择PDF文件,然后可以对话,注意每次都要引用文件。注意:这种方式,调用的是GPT-4 Turbo,会消耗自己的高级查询次数,一次对话是1点!
第二种方法,是点击侧边栏里的菜单,调出一个web页面,点击菜单右下角的ChatPDF,就有了左边的页面,可以选择GPT-3.5或Claude,我发现,Claude的效果是好于GPT3.5的!这种方式只消耗快速查询的次数(3.5的次数)。
当然,总体上的质量,显然是GPT4-Turbo最好,其次是Claude,最后是GPT3.5.
文章评论