跳转到内容

维基百科:字词转换/修复请求

维基百科,自由的百科全书
字词转换
主页 讨论
轉換請求
错误修复请求
地区词候选
轉換介紹
字詞轉換處理 讨论
  繁简处理 讨论
  地区词处理 讨论
  公共轉換組 讨论
帮助文档
繁简与地区词处理 讨论
  转换原理 讨论
  手工轉換 讨论
  高级语法 讨论
  用字模式选择说明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 界面文字轉換
地区用词 地區詞模板
地区用词2 進階地區詞模板
各地中文名 地區用詞資訊框
查看 - 讨论 - 编辑 - 变动

本页面为维基百科:字词转换下属子页面,用于处理各维基计划全域转换和中文维基百科本地全局转换中的所有繁简地区词错误转换修复的请求。

返回字词转换主页 提交错误转换修复新请求

轉換与修复原理

[编辑]

由於简体中文、繁体中文之间存在一对多现象,即以單一简化字或繁体字來对应多個繁體字或简化字[1][2],因此必須有額外的数据來補足原先丟失的信息。例如,繁體中的“髮”或“發”,在简体下都是“发”。在程序裡,我們有一個默认的對應,比如說“發”。那麼一般情況下要從簡體轉換成繁體時,程序遇到“发”就會先將其轉換成“發”。那麼什麼時候對應成“髮”呢?這就要看詞庫而定。比如詞庫中有“头发=>頭髮”的關係,這樣“头发”就會被轉換成“頭髮”。如果沒有這一關聯,那“头发”就會被錯誤地轉換成“頭發”。

那詞庫是如何创建的呢?我們先有每個字的默认對應,比如“发”轉換成“發”。然後我們在一個現有的繁體詞庫中尋找包含繁體“發”的词,再轉換成简体。這樣得到一個從简体到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的默认對應關係。同样,修復過度轉換也是由上述的方法來處理。

错误转换修复请求

[编辑]

由于格里

[编辑]
狀態:   待修复

请修复所有繁體模式下错误转换:「由于格里」,正确转换应为「由於格里」。其他說明:google搜尋site:zh.wikipedia.org "由于格里"--maki有事請留言 2025年10月4日 (六) 06:16 (UTC)[回复]

应该是“于格”造成的,需要修改ZhConversion.php。--Srapoj留言2025年10月12日 (日) 03:22 (UTC)[回复]
(~)補充:原先是看到「由于格里曆」這種的沒轉換到,之後又自行搜尋「由于格里」這詞,發現應該可擴大一些修復範圍(搜尋到後面接其他的有大概看,應是也要轉換),另外原來想在看看能不能再擴大又搜尋「于格里」,但看了一下發現有點不太行,就改為修復這個句子了,若可以的話看看還有沒有這種「x于格里x」這樣的轉換錯誤,不過也要留意那是不是接名稱的情況。--maki有事請留言 2025年10月17日 (五) 15:02 (UTC)[回复]

集吉他在

[编辑]
狀態:   待修复

请修复大陆简体模式下错误转换:「集吉他在」,正确转换应为「集结他在」。出错页面:弗里德里希·尼采。--~2025-28395-32留言2025年10月11日 (六) 18:40 (UTC)[回复]

修了,见版本89494522。--Srapoj留言2025年10月12日 (日) 03:13 (UTC)[回复]
不过搜insource:/集結他/以及insource:/集結-\{}-他/都还有一些其他结果。请其他人再来检查吧。--Srapoj留言2025年10月12日 (日) 03:43 (UTC)[回复]

晉昇 => 晋昇

[编辑]
狀態:   待修复

请修复大陆简体模式下错误转换:「晉昇 => 晋昇」,正确转换应为「晉昇 => 晋升」。出错页面:亞洲之春。其他說明:[[Wikipedia:字词转换/修复请求/存档/2024年2月#昇格_=>_昇格]]修过,似乎没完全修好?----Lucien09留言2025年10月16日 (四) 02:34 (UTC)[回复]

Wikipedia:字词转换/修复请求/存档/2024年2月。----Lucien09留言2025年10月16日 (四) 02:38 (UTC)[回复]

上麵團體

[编辑]
狀態:   待修复

请修复臺灣正體模式下错误转换:「上麵團體」,正确转换应为「上面團體」。出错页面:波希米亞和摩拉維亞保護國抵抗運動。--Bbss000留言2025年10月25日 (六) 16:28 (UTC)[回复]

“上面團體”是自然的語言表述嗎?個人感覺好像“上述團體”更符合中文書面語的習慣🤔--Michael nju留言2025年11月3日 (一) 06:27 (UTC)[回复]
看起來是「面团体」的鍋(有類似問題的條目),那會被當成「面团+体」後、轉換成「麵團+體」😅
可以用繁體的「團」簡便修復下。不過本例的話,個人覺得Michael君的「改用字」提議會更妥當些。--竹林月光 2025年11月5日 (三) 07:12 (UTC)[回复]

自身份析

[编辑]
狀態:   待修复

请修复zh-cn模式下错误转换:「自身份析」,正确转换应为「自身分析」。出错页面:draft:trae。其他說明:包含子字符串“身分”导致后一个词汇不可读。--User:Kurgenear(節刪) 2025年12月11日 (四) 17:39 (UTC)[回复]

“自身分析”的出现频率好像挺低的,可能没有必要在php转换表里排除。--Srapoj留言2025年12月11日 (四) 19:21 (UTC)[回复]
需要排除,因为 https://w.wiki/Gd8c#确认受影响页面超50个。--~2025-40528-96留言2025年12月13日 (六) 22:28 (UTC)[回复]
「身分 」是否一定要转换成「身份」?--Kethyga留言2025年12月15日 (一) 11:14 (UTC)[回复]
大陸搜尋了政府網站使用率,似乎是身份使用率多於身分:"身分" site:gov.cn"身份" site:gov.cn,剛去沙盒測試身分在大陸簡體下會轉成身份,不過我不是大陸人,可能仍是要本地人來說了。--maki有事請留言 2026年1月3日 (六) 15:49 (UTC)[回复]

[编辑]
狀態:   待修复

请修复繁體模式下错误转换:「製」,正确转换应为「制」。出错页面:看不見的手。其他說明:於「解讀」分部:「故此看不見的手所作出的干預使得市場機得以繼續運作」暫以「-{zh-hant:制;zh-hans:制}-」形式處理--heitung221留言2025年12月13日 (六) 15:33 (UTC)[回复]

看了一下,是“市場機制得以”觸發了繁簡轉換,我試了一下如果將zh-hans:机制;zh-hant:機制;加入全文轉換,也可以解決這個問題(因為繁簡轉換並非一個字一個字轉換,而是按照詞去匹配,加入“機制”一詞可以避免此種情況下“制”和“得”匹配到一起),不知道這個規則適不適合加入全局,這個得等管理員了(我只是一個路過群眾x)
關於這類繁簡情況下正確字相同的處理,其實有更簡單的策略:
1、本例子中“制”在繁簡表現相同,可以直接改作“市場機-{制}-得以
2、可以考慮使用-{}-進行斷字,如“新一只是一個男孩”顯示為“新一只是一個男孩”,而“新一-{}-只是一個男孩”則可以顯示為“新一只是一個男孩”,從而能夠避免手工羅列各種不同繁簡體下的正字
對於其他更加複雜的情況,大部分就只能採用您目前的方法了。--Michael nju留言2025年12月13日 (六) 15:52 (UTC)[回复]
搜了一下機制得,發現9個相關結果,都導致了類似的錯字(制製),加入全局轉換能在不引入誤判的情況下全數修復--Michael nju留言2025年12月13日 (六) 15:59 (UTC)[回复]
搜了一下法制得以,發現2個相關結果,都導致了類似的錯字(制製),不過鑒於“此法製得”(簡體為“此法制得”)和“法制得以”都存在“法制”這一公共部分,采用了手動修復。--Michael nju留言2025年12月14日 (日) 06:37 (UTC)[回复]
搜了一下制得以,發現好多複雜的轉換錯誤,例如“選舉制得以”、“建制得以”、“限制得以”、“體制得以”等等,都導致了類似的錯字(制製),感覺有點難辦--Michael nju留言2025年12月14日 (日) 06:42 (UTC)[回复]
全部读了一下,全數48處結果,僅有“製得以來”一處需用“製”(雖然理論上也會存在“製得以……為主的產物”這種用法,但目前未見),感覺可以再加入一個zh-hans:制得以;zh-hant:制得以;的轉換,雖然會導致部分誤轉換,但是極大降低了誤轉換的條目數量。(471)--Michael nju留言2025年12月15日 (一) 11:22 (UTC)[回复]
全局中有「制得 => 製得」转换,需要加入 「机制 => 機制」或「机制得 => 機制得」,维基百科上搜了下多数在化学类条目中使用。--Kethyga留言2025年12月15日 (一) 10:12 (UTC)[回复]

粉發

[编辑]
狀態:   待修复

请修复繁體模式下错误转换:「粉發」,正确转换应为「粉髮」。--紺野夢人 未曾立馬向吳山,萬古傳名爲逆賊 2026年1月3日 (六) 13:53 (UTC)[回复]

公佈

[编辑]
狀態:   待修复

请修复zh-hans模式下错误转换:「公佈」,正确转换应为「公布」。出错页面:香港电脑汉字参考字形。--Peterxy留言2026年1月10日 (六) 11:22 (UTC)[回复]

[编辑]
狀態:   待修复

请修复zh-cn模式下错误转换:「値」,正确转换应为「值」。出错页面:Wikipedia:新闻动态候选#巴尔哈姆·萨利赫。--Sksawf留言2026年1月12日 (一) 05:37 (UTC)[回复]

安瓦尔尔·萨达特

[编辑]
狀態:   待修复

请修复大陆简体模式下错误转换:「安瓦尔尔·萨达特」,正确转换应为「安瓦尔·萨达特」。出错页面:穆罕默德-礼萨·巴列维。其他說明:安瓦被NoteTA自动转换为安瓦尔,导致安瓦尔变成了安瓦尔尔--Maraschino Cherry留言2026年1月13日 (二) 13:20 (UTC)[回复]