跳至內容

「Wikipedia:字詞轉換處理」:修訂間差異

維基百科,自由的百科全書
刪去的內容 新增的內容
→‎转换技术:​ 修正内部链接
標籤2017 原始碼編輯
互助客棧討論通過,恢復指引地位
(未顯示由 2 位使用者於中間所作的 2 次修訂)
第3行: 第3行:
|G2 = MediaWiki
|G2 = MediaWiki
}}
}}
{{指引|WP:LC}}
{{字詞轉換索引}}
{{字詞轉換索引}}
{{Shortcut|WP:LC}}
字詞轉換處理即對[[Help:中文维基百科的繁简、地区词处理|繁简字、地区词的轉換处理]],本頁面闡述中文維基在字詞轉換使用中的一些基本要求。
字詞轉換處理即對[[Help:中文维基百科的繁简、地区词处理|繁简字、地区词的轉換处理]],本頁面闡述中文維基在字詞轉換使用中的一些基本要求。


第14行: 第14行:


繁简体之间的对应关系,不是简单的一对一,而是复杂的多对多。而维基百科所面临的问题,已经超出了繁简之间的字体转换问题。由于[[中國|大陆]]、[[香港|港]][[澳門|澳]]、[[台湾]]、[[马来西亚]]、[[新加坡]]等地多年来資訊文化獨樹一幟,许多外国译名以及新生词语也有非常大的分歧。如台湾所说的“-{帛琉}-”,在大陆却是“-{帕劳}-”,大陆使用“-{打印机}-”,台湾用的却是“-{印表機}-”。如此案例,屡见不鲜,且大大地超出了英语维基百科上英美词语之间的分歧。
繁简体之间的对应关系,不是简单的一对一,而是复杂的多对多。而维基百科所面临的问题,已经超出了繁简之间的字体转换问题。由于[[中國|大陆]]、[[香港|港]][[澳門|澳]]、[[台湾]]、[[马来西亚]]、[[新加坡]]等地多年来資訊文化獨樹一幟,许多外国译名以及新生词语也有非常大的分歧。如台湾所说的“-{帛琉}-”,在大陆却是“-{帕劳}-”,大陆使用“-{打印机}-”,台湾用的却是“-{印表機}-”。如此案例,屡见不鲜,且大大地超出了英语维基百科上英美词语之间的分歧。

中文維基百科的繁简体地區詞问题在[[User:Zhengzhu|Zhengzhu]]、[[User:Shinjiman|Shinjiman]]和许多用户的努力下,已经得到了初步解决。取消了過去的繁简分立体系,每个条目只保留一个版本,并通过电脑程序自动转换繁简体和地區詞。即不仅仅要处理繁体字和简体字的问题,还要处理大陆和港台之间词汇分歧问题,如“-{帕劳}-”和“-{帛琉}-”也应该实现自动转换。在以前存在有繁简体两个版本的文章现在仍然需要通过手工进行合并,但目前大致已經合併完成。具体请参看[[Help:中文维基百科的繁简、地区词处理#編輯一般文章時的注意事項]]。


== 基本要求 ==
== 基本要求 ==
第50行: 第52行:
{{main|Wikipedia:字詞轉換處理/公共轉換組}}
{{main|Wikipedia:字詞轉換處理/公共轉換組}}
对于一些主题、领域相同和相似的条目,其中需要被转换的内容是大同小异的,可以把这些多个条目中要用到的共同转换字词单独创建一个转换组。通过在页面的{{NoteTA}}模板中指定组名,实现该页应用这一公共组的地区词转换,所有应用该公共转换组的页面都可以不用单独维护,实现同步维护的目的。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。
对于一些主题、领域相同和相似的条目,其中需要被转换的内容是大同小异的,可以把这些多个条目中要用到的共同转换字词单独创建一个转换组。通过在页面的{{NoteTA}}模板中指定组名,实现该页应用这一公共组的地区词转换,所有应用该公共转换组的页面都可以不用单独维护,实现同步维护的目的。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。

{{維基百科方針與指引}}


[[Category:維基字詞轉換| ]]
[[Category:維基字詞轉換| ]]

於 2021年11月28日 (日) 18:14 的修訂

字詞轉換
首頁 討論
轉換請求
錯誤修復請求
地區詞候選
轉換介紹
字詞轉換處理 討論
  繁簡處理 討論
  地區詞處理 討論
  公共轉換組 討論
幫助文件
繁簡與地區詞處理 討論
  轉換原理 討論
  手工轉換 討論
  進階語法 討論
  用字模式選擇說明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 介面文字轉換
地區用詞 地區詞模板
地區用詞2 進階地區詞模板
各地中文名 地區用詞資訊框
檢視 - 討論 - 編輯 - 變動

字詞轉換處理即對繁簡字、地區詞的轉換處理,本頁面闡述中文維基在字詞轉換使用中的一些基本要求。

歷史

中文維基百科建立時,雖然只有用一個域名「zh.wikipedia.org」,但實際上有不少條目都寫了兩個版本,如法国法國(国↔國)就曾經是兩個不同的條目;繁簡名稱沒有區別的條目(如日本)也分成兩個條目(日本/简,日本/繁)。這個方法的好處在於:條目內部不存在繁簡問題,繁體條目使用繁體字、港台詞彙;簡體條目使用簡體字、大陸詞彙,兩者互不干擾。但這種方法卻大大增加了大家的工作量,因為繁簡版本之間很快地就不同步了,只能靠人工來整合繁簡之間的差異。

最早的中文維基每個條目都可能有繁簡分立的兩個版本。如何處理繁體簡體的並存,中文維基百科必須採取特殊的方法,不然就只能面臨繁簡分家的命運,這是中文維基百科自建立以來最為迫切的問題之一。

繁簡體之間的對應關係,不是簡單的一對一,而是複雜的多對多。而維基百科所面臨的問題,已經超出了繁簡之間的字型轉換問題。由於大陸台灣馬來西亞新加坡等地多年來資訊文化獨樹一幟,許多外國譯名以及新生詞語也有非常大的分歧。如台灣所說的「帛琉」,在大陸卻是「帕劳」,大陸使用「打印机」,台灣用的卻是「印表機」。如此案例,屢見不鮮,且大大地超出了英語維基百科上英美詞語之間的分歧。

中文維基百科的繁簡體地區詞問題在ZhengzhuShinjiman和許多用戶的努力下,已經得到了初步解決。取消了過去的繁簡分立體系,每個條目只保留一個版本,並透過電腦程式自動轉換繁簡體和地區詞。即不僅僅要處理繁體字和簡體字的問題,還要處理大陸和港台之間詞彙分歧問題,如「帕劳」和「帛琉」也應該實現自動轉換。在以前存在有繁簡體兩個版本的文章現在仍然需要透過手工進行合併,但目前大致已經合併完成。具體請參看Help:中文維基百科的繁簡、地區詞處理#編輯一般文章時的注意事項

基本要求

編者請不要將含有各種用字的原始碼全部轉換成同一種用字,尤其不要用本百科自動轉換的結果。但是,我們鼓勵用戶在擴充簡體頁面或與中國大陸有關的頁面時,盡量也使用簡體;擴充繁體頁面或與香港、臺灣有關的頁面時,盡量也使用繁體。注意:自動轉換程式可能會輸出很多錯誤結果

轉換技術

在技術上,維基百科的字詞轉換共透過四個層級來實現:其一是MediaWiki內建的轉換表ZhConversion.php,供各維基計劃全域轉換;其二是在[MediaWiki:Conversiontable]中定義的簡繁和地區詞轉換表,供中文維基百科本地全域轉換;其三是各公共轉換組,供主題領域相同和相似的條目統一轉換;其四是各條目內設置的手工轉換,供該條目單獨使用。其中,公共轉換組和條目內手工轉換人人均可編輯,而修改本地轉換表則需要管理員權限,修改全域轉換表需要向MediaWiki版本庫提交代碼。因此,如欲新增或修復全域及本地全域轉換,一般用戶需在維基百科:字詞轉換提出請求,交由管理員協助處理。

繁簡與地區詞轉換分開

「繁簡轉換」的意義應只是字體上的轉換(例如簡體的「打斗」會正確轉換成繁體的「打鬥」),而地區詞轉換旨在為中國大陸、台灣、新加坡、馬來西亞、香港、澳門地區的中文用戶提供貼近其語言習慣的轉換模式。其中,中國大陸(zh-cn)、新加坡(zh-sg)與馬來西亞(zh-my)的地區詞為簡體中文;台灣(zh-tw)、香港(zh-hk)與澳門(zh-mo)的地區詞為繁體(正體)中文。

目前維基系統用簡體轉換表繁體轉換表來處理繁簡全域轉換,用中國大陸轉換表港澳轉換表新馬轉換表臺灣轉換表來處理地區詞全域轉換。

原先地區詞的分歧,納入簡繁轉換全域系統處理,但其後發現這樣的做法產生不少問題:

  1. 地區詞與繁/簡體並無必然關係,正如「香港繁體區」的人一樣能以繁體書寫「大陸簡體區」常用的詞彙。
  2. 維基百科的簡繁轉換系統,與其他維基姊妹專案共用,如果簡繁轉換系統包含地區詞彙替換,可能會使其他維基的轉換不準確,例如不需要地區詞轉換的維基文庫
  3. 自動轉換過程會出現一些「失誤」,例如繁體的「數位人士」,轉換成簡體的時候會變成「数码人士」,要透過其他技術解決,造成編輯上的困難。

全域轉換是最為方便快速的轉換處理方式,但也較容易出現過度轉換的問題,基於以上各項理由:

  • 繁簡轉換除了一些轉換後出錯的詞彙外,都應當進入全域轉換中,盡可能不要手動繁簡轉換;
  • 而地區詞的轉換,由於會對全域轉換造成可能的失誤,應儘可能地用手動轉換實現,除了穩定和使用廣泛的地區對應詞彙,儘可能不要進入全域地區轉換。

即:對手動轉換,應當主要用於地區轉換,對全域轉換,應當主要用於繁簡轉換。

繁簡處理

用繁體或簡體建立的文章,標題必須是全部為簡體或繁體字,如果標題繁簡混雜,例如「中國历史」,那麼系統將無法自動轉換。

所有的簡繁轉換應當納入到全域轉換管理(zh-hans↔zh-hant)中,遇到有繁簡體的轉換出現問題,應當到Wikipedia:繁簡體轉換請求反映。

對於進入全域轉換後出錯的詞彙,可以採用下方的地區詞手動轉換處理方式,用{{NoteTA}}或其它相關模板在出錯的頁面中進行。

地區詞處理

公共轉換組

對於一些主題、領域相同和相似的條目,其中需要被轉換的內容是大同小異的,可以把這些多個條目中要用到的共同轉換字詞單獨建立一個轉換組。透過在頁面的模板中指定組名,實現該頁應用這一公共組的地區詞轉換,所有應用該公共轉換組的頁面都可以不用單獨維護,實現同步維護的目的。公共轉換組的方便程度處於全域轉換與全文轉換之間,而過度轉換程度也處於這兩者之間。