乱码转换,python 如何将乱码转成汉字

1,python 如何将乱码转成汉字将print(titles)改为for title in titles:print(title)应该就不会乱码了
2 , 如何用Word把复制来的网页乱码转换清零Word“替换”功能中好像有一项“字体”替换,乱码虽然在长度上没有规则,但其颜色却都是一样的 , 这不也是一种关键字吗?启动Word,将复制的文字粘贴到空白文档中 , 在默认状态下,Word是按源文件的格式进行显示的,所以这段文字在Word中和在网页中看到的效果是一样 的,乱码隐藏在白色背景中 。接下来点击菜单“编辑”中的“替换” , 在打开的“查找和替换”窗口中点击“高级”,展开替换的高级功能,接着点击“格式”下的“字体…” , 在打开的“字体”窗口中,点击“全部文字”中的“字体颜色”内的“下拉菜单” , 选择其中的“白色”注:有些网页中的防复制代码的颜色不是白色,比如是:#FCFCFC , 对这种不在常规中显示的颜色,我们就要采取自定义的方式 , 选择“其他颜色”窗口中的“自定义”面板,将其中的“红色”、“绿色”、“蓝色”分别设为“#FCFCFC”中所对应的十进制数值 。怎么将十六进制FC转为十进制数值呢?用WINDOWS的计算器吧,使用其的“科学型”方式,就可以将一个数值转为在十六、十、八、二进制数值 , 比如前面的十六进制FC,转为十进制就是252 。设置完字体颜色 , 点“确定”返回到“查找和替换窗口” 在“查找内容”中虽然没有内容,但其下的格式却给出了当前查找的关键字是字体颜色为“白色”的内容 , 接下来是“替换为”的设置,因为我们要将这些乱码替换 为空,所以在“替换为”中什么也不用输入,直接点击“全部替换”就可以了 , 待替换完成后查看一下效果,无论是更改Word的背景颜色,还是将这些文字复制 到文本文件中 , 均看不到乱码的踪迹了 。
3,word乱码怎样转换一、文档格式法 这种方法是将损坏的Word文档转换为另一种格式 , 然后再将其转换回Word文档格式 。这是最简单和最彻底的文档恢复方法 。1.在Word中打开损坏的文档后,选择“文件→另存为”,在“保存类型”列表中 , 选择“RTF格式(*.rtf)”,然后单击“保存”按钮 。2.关闭损坏的文档,打开刚才保存的RTF格式文件 , 选择“文件→另存为”,在“保存类型”列表中,选择“Word文档(*.doc)”,然后单击“保存”按钮 。3.关闭RTF文档,打开修改后的Word文档 。Word文档与RTF的相互转换将保留其格式 , 如果这种转换没有纠正文件损坏,则可以尝试与其他字处理格式的相互转换,这将不同程度地保留Word文档的格式 。如果使用这些格式均无法解决本问题,可将文档转换为纯文本格式(*.txt) , 再转换回Word格式 。由于纯文本的简单性,这种方法有可能更正损坏处 , 但是Word文档的所有格式设置都将丢失 。二、重设格式法 Word用文档中的最后一个段落标记关联各种格式设置信息,特别是节与样式的格式设置 。这样我们就可以将最后一个段落标记之外的所有内容复制到新文档,就有可能将损坏的内容留在原始文档中 。步骤如下: 1.在Word中打开损坏的文档 , 选择“工具→选项”然后选择“编辑”选项卡,取消“使用智能段落选择范围”复选框前的勾 。取消选中该复选框,选定整个段落时,Word将不会自动选定段落标记,然后单击“确定”按钮 。2.选定最后一个段落标记之外的所有内容,方法是:按“Ctrl+End”组合键,然后按“Ctrl+Shift+Home”组合键 。3.在常用工具栏中,依次单击“复制”、“新建”和“粘贴”按钮【乱码转换,python 如何将乱码转成汉字】
4,乱码文字转换正确的方法是怎样的右键点击此文件,然后在弹出的右键菜单当中选择打开方式一项 , 然后在跳出的次级菜单中选择用写字板打开,因为这样的格式是写字板的默认格式 , 当然可以完美支持 。文档成乱码的原因有很多,比如有些人为了伪装一些文档,会将一些文档的格式改为其他不正确的格式,这时我们打开此文档时 , 系统会默认其为修改后的格式,当然打开后会是乱码了 。先验证一下此文档的可靠性,或者再重新下载一遍再打开 。如果确认此文档是完好无损的 , 那么就有可能是打开此文档的软件不能完美支持这种格式,然后右键点击此文件,然后在弹出的右键菜单当中选择打开方式一项 , 然后在跳出的次级菜单中选择用写字板打开,因为这样的格式是写字板的默认格式 , 当然可以完美支持 。如果你得到的一篇文档用写字板用word均不能打开,你要试一些别的阅读软件,比如记事本等等 。如果用 word软件用写字板用记事本都不能打开这类文档 , 而且你也排除了文档损坏的可能性,那么就要考虑这种文件本身的格式了,毕竟文档的格式有很多,比如一个pdf文档当然是无法用上面的三个软件打开的,必须要用专业的pdf阅读器来打开查看,如果电脑中没有安装 , 就需要下载一个pdf阅读器来查看 。当然还会有一些特种的文件格式,是这些常规的软件都是无法打开的,如果非要用这些常见的软件打开,当然会显示乱码,所以,出现这样的情况,就要上网搜索一些特定的阅读软件了,比如你要打开一种ceb格式的文档,用常见的软件都是无法打开的,即使打开也是乱码,这时你就要上网搜索ceb格式阅读软件了,下载此软件后安装打开就可以查看这种格式的文档内容了 。再有一个原因就是可能系统中缺少相关的字体,比如有一个文档是用某种特定的字体编辑而成的,而且里面有复杂的内容,那么当此种字体丢失的时候,可能就会打不开这个文档,或者打开后是乱码,那么出现这种情况时你需要安装某种特定的字体,如果不清楚此种字体是哪一种,也可以试一下恢复系统 , 恢复之后可以还原所有的系统字体,就可以顺利打开了 。5,怎么样把文档里的乱码转换正常文字 就像这张图里的文档的字首先你要确定文件的完整性 , 损坏的文件会出乱码,如果是完整的就要根据文件的格式下载能完美兼容的软件 , 你可以先试一试电脑自带的写字板,记事本,word请用abbyy finereader ocr识别软件吧 。目前最新的版本是abbyy finereader 12 professional 版,可以识别 100多种语言,还有部分计算机语言 。有利器在手,我们当然要把它的强大功能尽可能地发挥出来 , 这里我就讲一下如何正确使用abbyy finereader 将pdf 文件转换成可编辑的格式 。工具/原料 abbyy finereader 11 professional 步骤/方法 首先我们要做的就是打开一个需要转换的 pdf 文件,然后看一下这个文件里面有几种语言,是不是有表格、图片等 然后运行abbyy finereader 11,点击欢迎界面“文档语言”下拉选择中的更多语言,弹出“语言编辑器”界面,我们设置好pdf 文件中所包含的几种语言 。因为文件文件中有 c++语言的内容,而 abbyy finereader 中正好也有 c++的选择,那么我们就毫不犹豫的打上勾 。设置完毕,点击右下角的“确定”按键 。回到任务界面,我们是想把pdf 转成可编辑的word 文件,所以我们点击中间的“文件(pdf/ 图片)到microsoft word”一项 弹出文件选择窗口,选择需要转换的pdf 文件,注意打开窗口的左下角那几个选项,默认都是打勾的,如果不需要的话可以去掉勾,然后点击“打开”按键 。abbyy finereader 开始加载文件,并且自动 ocr 识别处理 。如果页数比较多的话,可能需要花费一些时间,需要耐心等待一下 。由于自动识别会有一些错误,那么我就可以用手动工具进行修正 。我们可以选择不同的工具来修正 , 比如表格被识别成了普通文字,中间没有线框了,那么我们选择“表格”工具 , 然后把文件中的表格的区域选出来,然后右键“读取区域”就能够手动识别成表格了 。还有如果带有文字的图片被自动识别成了文字了,那么我们可以选择图片工具选出页面中的图片区域 , 然后在你识别本页面其他部分文字的时候,这个区域就会被识别成图片了 。“编辑图像”按键是用来预处理扫描页图片的,因为扫描页有时候会有倾斜、对比度不好、变形等问题,那么先对图像修正一下可以大幅度提高识别的准确率,调整完以后点击右上角的“退出图像编辑器”按键就可以回到上一界面 。识别完毕以后,选择菜单来的“文件”---“将文档另存为”---“microsoft word 文档”(如果你需要保存为其他格式你可以自己选择) 。弹出保存对话框,选择保存路径 , 如果需要保存完就打开文件的话,记得勾选下面的“保存后打开文档”选项 , 如果电脑配置不高的话不建议勾选此项,因为abbyy finereader 本身比较耗内存,然后再打开word 的话电脑可能会比较卡 。保存完文件,转换过程就基本结束了 。我们打开保存好的word 文件,看看转换的效果怎么样 。识别的区域基本上正常,中文英文、图像都可以识别出来,版面略微有些错位 , 不过还是含有部分错误,我们需要自己修改一下,但是这个已经可以大大降低我们的录入强度了 。注意事项 ocr 识别是肯定会存在错误的 , 所以大家识别转换完成以后记得要和原文核对 。设置语言种类的话,越少识别率越高,就是说如果文件只有中文的话,那么就设置中文一种语言 , 不要选择其他语言,这样识别速度也会提高 。abbyy finereader 理论上可以转换非加密的任意pdf 文件,但是如果扫描件的分辨率或者清晰度比较差的话 , 那么是不能被正确识别转换的 。6,怎么让乱码恢复成文字汉字乱码现象大致可分成四类:网页、文本、文档和文件乱码 。第一类是由于港台的繁体中文大五码(BIG5)与大陆简体中文(GB2312)不通用造成的;第二类是Win9X/Win2K系统(菜单、桌面、提示框)显示乱码,这是Win9X/Win2K注册表中有关字体的部分设置不当引起的;第三类是各种应用程序(包括游戏)本来显示中文的地方出现乱码,形成原因比较复杂,有第二类的乱码原因,也可能是软件用到的中文动态链接库被英文动态链接库覆盖造成的;最后一类是邮件乱码 。二、消除汉字乱码 针对以上几种乱码现象 , 我们来分类介绍消除乱码的方法 。(一)、网页、文本和文档文件乱码的消除 网页乱码是浏览器(如IE等)对HTML网页解释时形成的 。如果在网页的代码中有形如:〈HTML〉〈HEAD〉〈META CONTENT=“text/html;charset=ISO-8859-1”〉〈/HEAD〉……〈/HTML〉的语句,浏览器在显示此页时,就会出现乱码 。因为浏览器会将此页语种辨认为“欧洲语系” 。解决的办法是将语种“ISO-8859-1”改为GB2312,如果是繁体网页则改为BIG5 。另一种解决办法是不修改网页代码 , 事先为浏览器安装多语言支持包(例如在安装IE时要安装多语言支持包) , 这样在浏览网页出现乱码时,就可以在浏览器中选择菜单栏下的“查看”/“编码”/“自动选择”/简体中文(GB2312),如为繁体中文则选择“查看”/“编码”/“自动选择”/繁体中文(BIG5),其它语言依此类推选择相应的语系,这样可消除网页乱码现象 。还有一种解决办法是利用多内码显示平台来转换内码 。常用多内码显示平台有: “南极星”:可自动识别GB码、BIG5码,用简体或繁体显示,并能做到同屏显示GB码和BIG5码 , 对日文、韩文亦能正确显示 。下载地址: http:// www.njstar.com “四通利方”:支持了包括GB、BIG5、HZ、日韩编码、UNICOD等17种汉字内码 , 也开始支持预览功能 , 并且增加了诸如“增删空格”、“插入禁排空格”等小而有用的功能,实在是网友的好帮手 。下载地址: http:// www.srsnet.com “MagicWin 98”:可真正的同屏显示不同内码,即GB码和BIG5码两者共存、都能正常显示 。它支持GB、HZ、BIG5、JIS、EUC、SJIS、KSC、UTF7和UTF8等格式;支持Netscape Communicator 4.X、Internet Explorer 和Office 等软件;支持在多个窗口中同时查看不同内码的文档的超级多内码显示平台 。下载地址: http:// www.itwin.com.my/magicwin 网页无乱码保存的方法是:用浏览器打开网页时,在“查看”/“编码”中选择“自动选择” , 存盘时保存类型选“web页”,编码选择“UNICOD”,这样保存过的网页再次打开时 , 在浏览器菜单“查看”、“编码”中不管选择简体中文(GB2312)、简体中文(HZ)还是UNICODE(UTF-8)或繁体中文(BIG5),最终显示都不会出现乱码 。文本、文档文件乱码,一般是繁体中文显示在简体中文系统下或者相反情况造成的 。只要把原本是繁体的内码转换为简体内码(或者相反),就可消除乱码 。Word2000能胜任这类工作,例如要把繁体中文转换为简体中文,方法是:选择要转换内码的文件,在弹出的对话框中(如图1),选择“其它编码”中的“繁体中文(BIG5)”一项,打开此文件时就不会出现乱码 。无乱码保存方法:在保存时选择“文件”中的“另存为” , 先存为“Word文档,存盘后打开再存为纯文本等其它格式;您也可以用Word2000的“中文简繁转换”工具实现无乱码保存 , 方法是在菜单栏中选择“工具/语言/中文简繁转换”,内码转换后再保存 。WPS2000也能转换内码,支持GB2312、BIG5、GBK等三种主要的汉字编码,并可在输出RTF、TXT、HTM格式文件时对内码进行转换方法一:利用 word2002/2003 的"打开并修复"功能来修复文挡. (1)启动 word2002/2003,单击"文件-----打开",在"打开"对话框中选重要 修复的 word 文挡. (2)单击"打开"按钮右边的下三角按钮,在弹出的下拉菜单中选中"打开并修 复"选项,即可对损坏的文挡进行修复,修复完成后,显示文挡内容. 提示:"打开并修复"是只有 word2002 以上的版本才具有的功能. 方法二:转换文挡格式来修复文挡. 如果使用的是 word2002 以下的版本(如 word2000),可以用此方法来修复文挡. (1)启动 word2000 后单击"工具------选项-------常规".在该选项卡中选中 "打开时确认转换"复选框,并单击"确定"按钮. (2)单击"文件---打开",在弹出的"打开"对话框中选中要恢复的文件,并在 "文件类型"框中选中"从任意文件中恢复文本". (3)单击"打开"按钮自动对孙换文挡进行转换修复. (4)如果显示的文挡内容混乱,单击"文件---另存为",将文挡保存为"RTF 格 式"或其他 word 所识别的格式. (5)保存后关闭文挡,再次打开以"RTF 格式"保存的文挡即可看到完整的文挡. (6)再将文挡保存为"DOC 格式"即可,这样就完成了对孙换文挡的修复操作. 方法三:重设格式法 Word 用文档中的最后一个段落标记关联各种格式设置信息,特别是节与样式的 格式设置.这样我们就可以将最后一个段落标记之外的所有内容复制到新文档, 就有可能将损坏的内容留在原始文档中.步骤如下: ①在 Word 中打开损坏的文档,选择"工具→选项"然后选择"编辑"选项卡, 取消"使用智能段落选择范围"复选框前的勾.取消选中该复选框,选定整个段 落时,Word 将不会自动选定段落标记,然后单击"确定"按钮. ②选定最后一个段落标记之外的所有内容,方法是:按"Ctrl+End"组合键,然后按"Ctrl+Shift+Home"组合键. ③在常用工具栏中,依次单击"复制","新建"和"粘贴"按钮. 帮你找的方法 , 因为不能确定你的文档是因为什么出现了乱码,只能一个一个方法去试,还要注意备份原文件

    推荐阅读