【汉化教程】Python代码处理excel文件(二)

放在开头

书接上回,上篇教程教了怎么使用translator++,本篇教程教下大家怎么使用python代码处理excel文件,代码不一定具有普适性,目前我只用来处理过RMMV和Renpy引擎做的游戏。大家可以先看下后续代码效果的演示,再决定是否学习本篇教程。在我自己用的过程中,我觉得这代码用来处理RMMV引擎做的游戏效果很好,因为导出来的文本内好多代码;而Renpy引擎做的游戏的话导出来的文本很干净,可以不用进行处理,但也可以用我写的代码进行一些简单的处理。废话不多说,直接进入正题。

补充说明

我将代码部分合到这篇教程里了,代码要加的功能都已完成,代码追加的功能能保留原来的文本格式,减少一些手动操作,我们只需要复制生成的txt文件内的文本去GPT翻译,翻译完成后运行代码会将翻译好的文本插入到excel文件中,最后将excel文件导入到translator++即可完成GPT润色。

一、工具资源

本篇教程下面三个文件是必要的。

【汉化教程】Python代码处理excel文件(二) 51

OneDrive

提取码:0124复制
解压码:sxdf复制

文本润色使用GPT3.5。

GPT官网:ChatGPT (openai.com)

二、代码效果演示

大家可以先看看效果再决定是否学习此教程。

总共有两个代码文件。

(一)text_analysis.py代码效果演示

①下面这个这是translator++直接导出来的excel文件。

【汉化教程】Python代码处理excel文件(二) 52

②下面这个是代码处理后新生成的excel表格

序号⑨是个占位符,后续翻译好的文本会导入进来替换⑨,省了我们自己修改文本格式,少部分文本还是得手动调一下。

【汉化教程】Python代码处理excel文件(二) 53

③下面这个是代码生成的txt文本文件,直接把里面的内容复制到GPT翻译即可

序号⑧是个占位符,后续会替换成换行符,直接复制到GPT润色即可,GPT不会去翻译这个序号。

【汉化教程】Python代码处理excel文件(二) 54

(二)GPT翻译演示

【汉化教程】Python代码处理excel文件(二) 55

【汉化教程】Python代码处理excel文件(二) 56

(三)text_to_excel.py代码效果演示

因为只是演示下效果,所以只复制了上图翻译好的文本

【汉化教程】Python代码处理excel文件(二) 57

代码把翻译好的文本插入到了之前新生成的excel表,红圈标注的这行后续还得手动调一下,少部分没处理干净的文本还得自己调格式。

【汉化教程】Python代码处理excel文件(二) 58

以上就是本教程的代码功能展示,用来处理RMMV引擎的游戏文本效果比较好,其他引擎不一定具有泛用性,有需要的可以学习下面的教程使用。

三、环境搭建

(一)Python和Pycharm的安装

这个大家可以看这篇文章,我就不在这篇文章内啰嗦了。

(超详细)Python+PyCharm的安装步骤及PyCharm的使用(含快捷键)_python pycharm-CSDN博客

看下面红圈标注的两个就行,环境准备就是下载Python和Pycharm,我在资源文件夹里都放好了。CSDN是国内的网站,如果连不上的话把梯子关了

【汉化教程】Python代码处理excel文件(二) 59

(二)代码的使用

到了这一步我就默认你前面的都搞好了。直接上图文教学吧。

①修改镜像源

把软件下载库的镜像源改成国内的,这样不挂梯子的情况下,下载代码运行需要的库要快不少。

软件左上角file→settings

【汉化教程】Python代码处理excel文件(二) 60

→project→project interpreter→+

【汉化教程】Python代码处理excel文件(二) 61

→manage Repositories

【汉化教程】Python代码处理excel文件(二) 62

→+,然后会弹出个框框,把下面那个镜像源输入就去点OK返回就行了,后面设置那里也得点OK,不然不会生效

清华镜像源(复制这个链接添加进去,添加后如下图所示):

https://pypi.tuna.tsinghua.edu.cn/simple/

【汉化教程】Python代码处理excel文件(二) 63

②创建工程

左上角file→new project

Location你自己指定一个项目工程存储位置,尽量别放C盘占磁盘空间。再下面那条红线是选择你的Python安装位置下的python.exe

【汉化教程】Python代码处理excel文件(二) 64

创建好工程后把我给的代码复制到工程下。右键项目文件夹,把我给的代码文件粘贴过来。

【汉化教程】Python代码处理excel文件(二) 65

导入后,可以看到代码有点报红,那是运行代码所需的库还没下载。

【汉化教程】Python代码处理excel文件(二) 66

③下载运行代码需要的库

【汉化教程】Python代码处理excel文件(二) 67

点击上图的位置,弹出终端的窗口,将下面两行命令分别复制到命令行执行下载即可。

pip install openpyxl
pip install pandas

输入命令,点击回车,显示successfully…则说明安装成功,然后再安装另一个库。要是出问题就把梯子关了试试。

【汉化教程】Python代码处理excel文件(二) 68

④修改代码

到了这一步该搞的都搞完了,剩下的就是跑代码了。上图文简单介绍下这个代码需要改的地方和一些自定义的地方。

text_analysis.py代码,这个代码的效果上文已经演示过了,是用来处理excel文件,生成新的excel文件和txt文件的。

【汉化教程】Python代码处理excel文件(二) 69

13行代码指定你导出的excel文件所在的文件夹路径,注意路径内的斜杠是“/”,别弄错了。

15行代码指定输出的文件夹路径。

17、19行代码指定需要删除的excel文本类型,匹配规则是匹配以“PA_”等开头的代码文本。这个是自定义的,你也可以自己加上别的引擎类型,参照我上面的格式即可。加入匹配规则的话是再[]中加入,格式参照上图即可,例如:Renpy_delList = [“PA_”],想设置多个规则的话在后面加, “***”(Renpy_delList = [“PA_”, “P_”])。这些符号都是英文字符,别出现中文字符

22行代码指定你要用哪个匹配规则,不同的游戏类型需要处理的文本有差异,delList = ***(这里选择17、19行定义的匹配规则即可,例如:delList = Renpy_delList)

24、25行代码指定文本内需要删除的字符,填入规则参考上图格式,与17、19行代码一样。确保要删除干净,没删干净的话后面不能确保后续的格式问题。比如下面这个文本:

\N[2] \F[1]

「ここですか…?重点的に攻めてあげますね…っ!」

需要删除的包括\N[2]、\F[1]、「、」。这种带斜杠的字符写入规则时要这样写[“\\N[1]”],要多加一条\,不然会报错。至于「、」这种特殊的字符,需要写入字符码,不知道的可以问GPT(字符码的话就别多加斜杠了,直接复制GPT给的字符码过去就行)。

【汉化教程】Python代码处理excel文件(二) 70

26行代码和22行代码一个意思,指定你需要删除文本内字符的匹配规则,del_char = ***,选择24或25行定义的规则填入(你也可以自定义)。例如:del_char = Renpy_delChar。

 

text_to_excel.py代码,这个代码要修改的地方比较少,自定义下路径即可。这个代码的效果是将翻译好的txt文件内的文本插入到excel表格中,上文已经演示过效果了。
【汉化教程】Python代码处理excel文件(二) 71

14行代码改成你翻译好的txt文本文件夹路径。

16行代码就是上个代码的输出路径,这个是新生成的excel表格的文件夹路径路径的斜杠是’/’,而不是’\’

注意:存放翻译好的txt文本文件,保持和excel同名(比如:Map001.xlsx,存放翻译好的文本的txt文件应命名为Map001.txt)

⑤运行代码

右键代码文件,选择Run运行代码。(先运行text_analysis.py文件,再将生产的txt文件内的文本复制到GPT翻译

【汉化教程】Python代码处理excel文件(二) 72

运行结束,出现全部文件已处理完成则说明没问题。运行代码的过程中,请注意别打开目录下的excel文件,否则代码会运行异常。

【汉化教程】Python代码处理excel文件(二) 73

等你翻译完成后再右键执行text_to_excel文件即可将翻译好的文本插入到excel文件内。

⑥导入到translator++

在translator++点击导入,选择导入xls……这个,然后选择要导入的文件夹或者选择单个文件,将文本导入到translator++后,自己再修改下部分文本格式,以及结合谷歌翻译进行最后的人工润色(有的文本GPT翻译的不如谷歌,尤其是色情文本,GPT翻译不出来)

【汉化教程】Python代码处理excel文件(二) 74

⑦补充说明

如下图红线处所示,代码处理文本符号时把文本内的都给删掉了,这会曲解原文本意思。自己最后人工润色文本的时候,记得补上。原文应该是问你设为\N[1]这个名字行不行,\N[1]指代的是主角的名字。

【汉化教程】Python代码处理excel文件(二) 75

还有就是官网GPT3.5翻译不了色情文本,复制进去的时候注意删掉那行文本。大家使用代码的时候请注意按照我图片中的示例使用,比如txt文本文件,务必一个序号占一行,别将两个序号的文本放在同一行,可以跳过某些序号。

放在结尾

python代码处理excel文件的教程到此也是结束了,后续我应该不会继续修改这两个代码了,现在已有的功能差不多了。这两篇教程其实都不难,只要大家有心学,学习最重要的还是动手实操,有想法的朋友可以学起来。大家在学习的过程中遇到什么问题,欢迎在评论区提问。然后我在汉化Red Brim的过程中遇到了些小问题,这游戏是Renpy引擎做的游戏,后续我可能还会出教程分享我写的python代码辅助处理文本文件,python代码在处理文本文件上效率还是很高的。对汉化感兴趣的可以留意我后续发的教学,如果能够帮到你我会感到很高兴。

至此结束,喜欢的朋友可以点个赞。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得UP主同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理:DMCA投诉/Report
学习区-技术教程

如何得到KS剧本文件

2023-12-16 14:34:55

学习区-技术教程

【汉化教程】python代码矫正Renpy文本文件(三)

2023-12-30 17:19:34

5 条回复 A文章作者 M管理员
  1. 随心的云

    这两篇文章内的代码大家想用的话可以放心用,后续我就算要优化代码也是在这两个代码的基础上做一些改进,需要你们进行自定义修改的部分基本不变,代码的意义是尽可能的减少大家一些手动操作

    • 随心的云

      这两个代码用来处理rmmv引擎的文本效果比较好,如果是像renpy这种文本比较干净的情况,效果就不是太明显了,但也可以用来生成txt文本文件复制去gpt翻译,然后再将翻译好的文本插入到excel文件内。总之,大家视自身需求决定是否学习,后续我也还会分享一些代码解决我汉化过程中遇到的一些文本文件处理上的问题,有兴趣的可以留意我后续发布的教程

  2. Hellen

    大佬阿,支持並期待後續

    • 随心的云

      代码已经写完了,你可以看看代码效果再决定是否学习,文章里有代码效果演示

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索