EmEditor v22.0.0 发布(含技术评论)!
我们发布了 EmEditor v22.0.0。
EmEditor v22.0 的一个主要功能是模糊匹配,它可以使用可自定义的近似字符串匹配来搜索、筛选和合并 CSV。多个用户要求了此功能(1,2,3)。此功能在 EmEditor Professional 中包含多个选项,而在 EmEditor Free 中只有匹配相似字符串选项可用。匹配相似字符串选项使用称为莱文斯坦距离或编辑距离来计算两个字符串的相似程度。换句话说,EmEditor 比较两个字符串并计算从一个字符串编辑到另一个字符串需要多少步。 例如,如果两个字符串是:
"fuzzx maching" 和 "fuzzy matching"
第一个字符串的第五个字符“x”必须替换为“y”,并且必须在第 9 个字符“c”之前插入一个“t”。因此,这两个字符串之间的编辑距离变为 2。
如果您在 EmEditor Professional 的 查找 对话框中选择模糊匹配复选框,则会出现模糊匹配选项对话框,让您可以使用相似程度和最大编辑距离选项来确定匹配的相似程度。例如,如果相似程度为 3/4 (75%),则最多允许每 4 个字符中有 1 个编辑距离匹配,但不能超过最大编辑距离选项中指定的编辑距离。换句话说,如果字符串的长度为 4 或更大,则最多允许匹配 1 个编辑距离,如果字符串的长度为 8 或更大,则最多允许匹配 2 个编辑距离。
在 EmEditor Professional 中,模糊匹配功能提供了更多选项。无需设置上述匹配相似字符串选项即可使用以下所有选项。其中,忽略不占位的组合字符,例如变音符号、dakuten(日文中的浊点)和 handakuten(日文中的半浊点)选项特别有用,如果您想忽略变音符号、dakuten、handakuten 和其他不占位的组合字符(表情符号除外)。例如,匹配
"e" with "é" "c" with "ç" "ハ" with "パ"
当选择忽略不占位的组合字符,例如变音符号、dakuten(日文中的浊点)和 handakuten(日文中的半浊点)选项时,EmEditor 在比较之前将 Unicode 标准化表单 D(规范分解)应用于两个字符串,并在比较字符串时忽略不占位的组合字符。
忽略 Emoji 序列选项会忽略表情符号序列,序列的第一个代码值除外。 例如:
"👨🦰" (red hair man, U+1F468 U+200D U+1F9B0) and "👨🦳" (white hair man, U+1F468 U+200D U+1F9B3)
不会被区分。
字符串/字符范围 选项可以最大程度地灵活定义字符串的相似程度。例如,如果您指定将连字符“-”视为空格“ ”,则不会区分以下两个字符串。
"fuzzy-matching" and "fuzzy matching"
如果您指定要忽略的与号“&”,则不会区分以下两个字符串。
"fuzzy" and "fu&zzy"
您还可以通过选择 Unicode 脚本、Unicode 一般类别、最小和最大字符代码值或这些值的组合来指定字符范围。例如,如果您指定忽略 Unicode 一般类别“Pc,Pd,Pe,Pf,Pi,Po,Ps”,则字符串中的所有标点符号都将被忽略。因此,将不会区分以下两个字符串。
"Emurasoft, Inc." and "Emurasoft Inc"
模糊匹配选项对话框中提供了更多选项。详细信息,请参阅帮助。
如果您在“查找”或“筛选”命令中使用模糊匹配选项,被模糊匹配但不相同的字符串会由蓝色的摆动下划线标示。如果您将鼠标指针悬停在这些蓝色的摆动下划线上,未来版本的 EmEditor 将显示一个工具提示,允许您复制或修复这些模糊匹配的字符串。
模糊匹配选项在查找、替换、在文件中查找、在文件中替换、批处理查找、批处理替换、批处理在文件中查找、批处理在文件中替换以及合并 CSV对话框中使用,另外在查找和筛选工具栏上也有对应的按钮。模糊匹配选项目前是全局应用设置,并通过所有这些对话框和工具栏共享。
如果您在合并 CSV 对话框中使用模糊匹配选项,您将能够合并两个具有相似匹配字符串的 CSV 文档。假设您有以下两个 CSV 文档:
ID Company 1 Emurasoft, Inc. 2 Microsoft Corporation 3 Apple Inc.
State Company CA Apple Inc WA Microsoft Corp. WA Emurasoft Inc
您想以公司名称来合并这两个 CSV 文档。之前版本的 EmEditor 无法正确合并这两个文档,因为“Emurasoft, Inc.”与“Emurasoft Inc”不匹配。现在,模糊匹配让您能指定要忽略的标点符号,并将“Corp”视为“Corporation”。 因此,结果将变为:
ID Company State Company 1 Emurasoft, Inc. WA Emurasoft Inc 2 Microsoft Corporation WA Microsoft Corp. 3 Apple Inc. CA Apple Inc
您还可以将模糊匹配选项应用于批处理查找或批处理替换对话框中定义的所有搜索字符串。要设置或清除所有批处理项目的模糊匹配选项,请先选取批处理列表中的所有项目,右键单击以显示菜单,您可以在其中切换模糊匹配选项。但是,如果您有很多搜索字符串或文档非常大,模糊匹配选项会大大地降低搜索速度。
EmEditor v22.0 的其他功能还包括能够高亮显示用于电子邮件报文的头部多用途互联网邮件扩展(MIME)编码的字词(Base64)。例如,如果消息头部包含以下行:
Subject: =?UTF-8?B?W0VtRWRpdG9yICjjg4bjgq3jgrnjg4jjgqjjg4fjgqPjgr8pXQ==?= =?UTF-8?B?IOOCqOODs+OCs+ODvOODieOBruWumue+qeOBq+aXouWumuWIhui/veWKoA==?=
EmEditor 将高亮显示这些行,并显示一个工具提示,如果您将鼠标指针悬停在这些行上,就可以显示或复制原始字符串。
一个用户要求能够自定义剪贴板中字符串的粘贴方式。如果您从垂直选择中复制一个字符串并将其粘贴到纯文本中,结果可能与您期望的不完全一样。在这种情况下,单击粘贴后出现的剪贴板图标,在显示的剪贴板历史记录窗口中右键单击刚刚粘贴的字符串会弹出一个上下文菜单,您可以在其中选择作为字符插入、作为行插入、垂直插入或作为单元格插入命令。
默认的主菜单经过重新设计,包括了插入、转换、书签、排序,以及插件菜单项。如果您的键盘不包含专门用于变音字符的键,当您需要键入这些字符但记不住相应的快捷键时,插入菜单中的变音符号子菜单会变得很有用,让您能快速访问这些命令。希望您喜欢这些更改,但如果您不喜欢,您随时可以通过工具菜单下的自定义菜单来调整菜单。
v22.0 支持 Unicode 15.0。例如,以下字符是添加到 Unicode 15.0 的新表情符号字符。
🫨 U+1FAE8 (SHAKING FACE) 🩷 U+1FA77 (PINK HEART) 🫎 U+1FACE (MOOSE) 🛜 U+1F6DC (WIRELESS)
虽然需要支持 Unicode 15.0 的字体才能正确显示上述字符,但将它们复制并粘贴到 EmEditor 中,将光标放在每个字符的左侧的同时使用字符代码值命令 (Ctrl+I) 将显示其正确的 Unicode 名称。此更新会影响字符代码值命令显示的 Unicode 名称、Unicode 脚本和 Unicode 一般类别。它还会影响由东亚宽度和字符检查功能决定的字符宽度。但是,此更新不会影响 Onigmo 正则表达式引擎,该引擎目前仍基于以前版本的 Unicode。
最后,CommitList (Git)插件也添加了比较分支的功能以及其他改进,让此插件更易于使用。
希望您喜欢 EmEditor,无论您使用的是专业版(Professional)还是免费版(Free)。如果您有任何问题、功能请求或想法,请随时联系我们或到论坛中留言。
感谢您使用 EmEditor!
— Yutaka Emura
详细信息和屏幕截图,请参阅 EmEditor v22.0 新增特性。
此发布还包括了所有在在开发 v22.0 时修复的 bug。
如果您使用的是桌面安装程序版,那您可以到帮助菜单下选择检查更新来下载最新版本。 如果此方法失败,请下载最新版本,并运行下载的安装程序。 如果您使用的是桌面便携版,则可以转到下载页面下载最新版本。商店应用版可以在几天后通过 Microsoft 商店更新( 64 位 / 32 位)。
感谢您使用 EmEditor!