「Wikipedia:繁简处理」:修訂間差異

維基百科,自由的百科全書
刪去的內容 新增的內容
第49行: 第49行:
儘管[[異體字]]間的功能相近,且所代表的意義相同,但手動轉換異體字,很可能引發編輯爭議,甚至招致編輯戰的發生。因此在手动转换异体字之前,请先考虑以下两种情况:
儘管[[異體字]]間的功能相近,且所代表的意義相同,但手動轉換異體字,很可能引發編輯爭議,甚至招致編輯戰的發生。因此在手动转换异体字之前,请先考虑以下两种情况:


一是在[[现代汉语]]中或者电脑输入中已经不再使用或者极少使用的异体字,如「-{靑/青}-」、「-{敎/教}-」、「-{囯/国}-」,这种情况下,将异体字转换为正体字是值得提倡的,反之则视为破坏。因为此类异体字在电脑输入或者现代汉语中极少用到,使用此类异体字不便于阅读。
一是在[[现代汉语]]中或者电脑输入中已经不再使用或者极少使用的异体字,如「-{靑/青}-」、「-{敎/教}-」、「-{囯/国}-」、「-{敍/敘}-」,这种情况下,将异体字转换为正体字是值得提倡的,反之则视为破坏。因为此类异体字在电脑输入或者现代汉语中极少用到,使用此类异体字不便于阅读。


二是目前现代汉语中仍然有在使用的异体字,此类异体字由于使用频率较高,或者是在不同的地区,对哪一个字是正体的定义不一样,例如「-{床/牀}-」,中国大陆和台湾把「-{床}-」视为正体字,把「-{牀}-」视为异体字,而在香港则是相反,香港视「-{牀}-」为正体,对此类异体字进行手动转换违反了[[WP:避免地域中心|避免地域中心方針]]。此外,「-{台/臺}-」这一对字由于政治原因常常成为修改的对-{}-象,由于「-{台}-」字虽为[[繁體俗字|俗写]],但是在台湾已经广泛使用,因此不应该对其进行手动转换,而是应该遵循先到先得的原则,因为对这些字进行手动转换对条目没有实际的改善作用。
二是目前现代汉语中仍然有在使用的异体字,此类异体字由于使用频率较高,或者是在不同的地区,对哪一个字是正体的定义不一样,例如「-{床/牀}-」,中国大陆和台湾把「-{床}-」视为正体字,把「-{牀}-」视为异体字,而在香港则是相反,香港视「-{牀}-」为正体,对此类异体字进行手动转换违反了[[WP:避免地域中心|避免地域中心方針]]。此外,「-{台/臺}-」这一对字由于政治原因常常成为修改的对-{}-象,由于「-{台}-」字虽为[[繁體俗字|俗写]],但是在台湾已经广泛使用,因此不应该对其进行手动转换,而是应该遵循先到先得的原则,因为对这些字进行手动转换对条目没有实际的改善作用。

於 2022年6月8日 (三) 10:20 的修訂

字詞轉換
首頁 討論
轉換請求
錯誤修復請求
地區詞候選
轉換介紹
字詞轉換處理 討論
  繁簡處理 討論
  地區詞處理 討論
  公共轉換組 討論
說明文件
繁簡與地區詞處理 討論
  轉換原理 討論
  手工轉換 討論
  進階語法 討論
  用字模式選擇說明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 介面文字轉換
地區用詞 地區詞模板
地區用詞2 進階地區詞模板
各地中文名 地區用詞資訊框
檢視 - 討論 - 編輯 - 變動

中文維基百科裡,繁簡處理地區詞處理字詞轉換系統的兩大組成部分。繁簡轉換旨在為使用者提供只針對單字的轉換(並包括繁簡/簡繁一對多的轉換,例如簡體的「打斗」會正確地轉換成繁體的「打鬥」),是進一步實現地區詞轉換的基礎。本頁面提出一些進行繁簡轉換編輯維護的指引。

維基百科簡體字繁體字的轉換,是指中華人民共和國所制定規範漢字與華語圈傳統漢字之間的轉換,轉換範圍基本以《通用規範漢字表》為準,但亦會根據民間習慣和實際需要作彈性調整。

全域轉換

維基百科的繁簡轉換總共透過三個轉換表來實現:其一是MediaWiki內建的轉換表ZhConversion.php,其二是在MediaWiki:Conversiontable/zh-hans中定義的簡體中文轉換表、其三是在MediaWiki:Conversiontable/zh-hant中定義的繁體中文轉換表。

如果您遇到了以下三種情況,請前往Wikipedia:字詞全域轉換修復請求中提報,管理員會儘快進行處理,而無需透過手工轉換來修復:

  1. 繁簡/簡繁一對多的轉換出現錯誤。例:「乾隆」被過度轉換成了「干隆」(由於「繁體:乾=>簡體:乾、干」的一對多轉換);
  2. 地區詞的全域轉換出現錯誤。例:「東加拿大」被過度轉換成了「汤加拿大」(由於「臺灣正體:東加=>大陸簡體:汤加」的地區詞全域轉換),「撒贝宁」被過度轉換成了「撒貝南」(由於「大陸簡體:贝宁=>臺灣正體:貝南」的地區詞全域轉換);
  3. 某一個單字沒有被轉換。例:「東」未被轉換成「东」,但此種情況較為罕見。

注意事項

條目標題

用繁體或簡體建立的頁面,相應的標題必須全部為繁體或簡體字。如果標題繁簡混雜,例如「中國历史」,那麼系統將無法自動轉換。如果您發現了這樣的頁面,請將它移動到簡體標題或繁體標題,然後將重新導向頁面掛上{{d|R3}}標籤;但某些會被系統視作簡體字的傳承字俗字(如「杰」、「灯」等)除外(是否為簡體字應視具體情況而定)。

如果有繁簡體兩個版本的文章,則必須進行合併。具體參見Help:中文維基百科的繁簡、地區詞處理#編輯一般文章時的注意事項。通常這樣的情況很少見,維基程式會自動在你建立條目時判斷有無對應繁簡的條目並做出處理,但透過移動等方式也會產生同一事物的繁簡兩個版本條目。

若某頁面已存在繁體中文標題的頁面,則不得建立簡體中文標題的相同內容的頁面,反之亦然。例如,已存在名為哈萨克的條目,則不能建立名為哈薩克的條目,但可以建立繁簡重新導向哈萨克條目。

勿與地區詞轉換相混淆

雖然繁簡轉換與地區詞轉換都使用相同的轉換技術,但它們發揮的功能並不一樣,因此,請不要將地區詞的全域轉換請求提交到Wikipedia:繁簡體轉換請求中。如需了解更多相關的內容,請參見Wikipedia:地區詞處理

勿手動轉換條目繁簡語句

編輯維基百科條目的時候,如果缺乏正當理由,請不要手動地將條目原始碼中的繁體語句轉為簡體,或將簡體轉為繁體(廣義地也包括將一個地區用詞轉換成另一地區用詞,如港澳繁體轉換成臺灣正體),以免影響他人的編輯和閱讀。手動做這種轉換可能將被視為「繁簡破壞」,見Wikipedia:破壞#破壞類型中的「繁簡破壞」一條

對於讀者來說,想只看繁體或簡體,可以在介面上方選擇「大陆简体」、「香港繁體」、「澳門繁體」、「大马简体」、「新加坡简体」與「臺灣正體」六者之一;對於編者來說,若想修正機器無法轉換正確的詞彙,可以使用手工轉換語法,形如-{zh-hans:一般简体词汇; zh-hant:一般繁體詞彙; zh-cn:大陆简体词汇; zh-tw:臺灣正體詞彙; zh-hk:香港繁體詞彙; zh-mo:澳門繁體詞彙; zh-my:大马简体词汇; zh-sg:新加坡简体词汇}-,或者{{NoteTA}}模板。總之手動轉換條目繁簡語句是沒有必要的。

一種例外是當繁簡並非一對一轉換,且該字不與上下文形成詞彙而不適宜使用全文轉換時,為了簡便地修復錯誤的繁簡轉換,可改為不會造成轉換錯誤的用字。修復錯誤轉換時,應優先使用不存在歧義且不會造成錯誤轉換的字形。例如在簡體和港澳繁體有「着」、「著」兩種字形,在臺灣正體僅有「著」字形,在原始碼輸入「着」時可由系統自動轉換成臺灣正體「著」,但反之則不會轉換,因此以台灣正體輸入「吸著」一詞時無法正確轉換為簡體和港澳繁體,此時容許直接將原始碼修正為「吸着」以修正轉換錯誤,如果在內文直接使用轉換規則(例如「吸-{zh-hans:着; zh-hk:着;zh-tw:著;}-」)時,也允許將原始碼簡化為「吸着」。更詳細的範例可參考Wikipedia:非一對一字詞轉換錯誤修正指南

請注意:若您的瀏覽器安裝了中文繁簡轉換軟體,或可以進行中文繁簡轉換的行動應用程式,請在編輯時將其關閉或移除。

勿手動轉換異體字

儘管異體字間的功能相近,且所代表的意義相同,但手動轉換異體字,很可能引發編輯爭議,甚至招致編輯戰的發生。因此在手動轉換異體字之前,請先考慮以下兩種情況:

一是在現代漢語中或者電腦輸入中已經不再使用或者極少使用的異體字,如「靑/青」、「敎/教」、「囯/国」、「敍/敘」,這種情況下,將異體字轉換為正體字是值得提倡的,反之則視為破壞。因為此類異體字在電腦輸入或者現代漢語中極少用到,使用此類異體字不便於閱讀。

二是目前現代漢語中仍然有在使用的異體字,此類異體字由於使用頻率較高,或者是在不同的地區,對哪一個字是正體的定義不一樣,例如「床/牀」,中國大陸和台灣把「床」視為正體字,把「牀」視為異體字,而在香港則是相反,香港視「牀」為正體,對此類異體字進行手動轉換違反了避免地域中心方針。此外,「台/臺」這一對字由於政治原因常常成為修改的對象,由於「台」字雖為俗寫,但是在台灣已經廣泛使用,因此不應該對其進行手動轉換,而是應該遵循先到先得的原則,因為對這些字進行手動轉換對條目沒有實際的改善作用。

概括性來講:

  • 如果所有地區皆常用A,罕用B→可將原始碼B直接改為A,不宜使用轉換。
  • 如果某些地區常用A而罕用B,某些地區常用B而罕用A→原始碼文字先到先得,不得修改,同時全域轉換。
  • 如果所有地區混用A/B→原始碼文字先到先得,不得修改,不得使用轉換。
  • 如果某些地區混用A/B,其他地區常用A而罕用B→原始碼文字先到先得,不得修改,其他地區可使用轉換。

日本漢字及其他不應進行繁簡轉換的情形

因為日本漢字不屬於中文,所以日本漢字不應參與中文的繁簡轉換。但是,部分日本漢字與中文漢字存在重疊,系統可能誤將其認作中文而轉換。這種情況下,您應當使用{{lang|ja|日本語漢字}}來防止其被誤轉換。

如果是因為其他原因需要避免簡繁轉換的(如在一些網站,簡體和繁體的使用者名稱被視作兩個不同的帳號),可以用-{汉字漢字}-<nowiki>汉字漢字</nowiki>來達到禁止轉換的效果。在使用cite系列模板標記參考來源時,遇日文漢字可使用|script-title=ja:XXX展示來源標題。(韓文漢字的情況同理,使用|script-title=ko:XXX展示來源標題。)

外部連結