Wikipedia:字詞轉換處理:修订间差异

维基百科,自由的百科全书
删除的内容 添加的内容
調整格式、排版
修飾語句
标签2017年版源代码编辑
第10行: 第10行:
== 歷史 ==
== 歷史 ==


中文维基百科建立时,虽然只用一个域名“zh.wikipedia.org”,但实际上有不少条目都写了两版本,如-{[[法国]]和[[法國]]}-(-{国↔國}-)就曾经是两不同条目;繁简名称没有区别的条目(如[[日本]])也分成两条目(日本/-{简}-,日本/-{繁}-)。这方法的好处在于:条目内部不存在繁简问题,繁体条目使用繁体字、港台詞彙;简体条目使用简体字、大陆词汇,两者互不-{干}-擾。但这种方法却大大增加了大家的工作量,因为繁简版本间很快就不同步,只能工来整合繁简之间的差异。
中文维基百科建立时,虽然只用一个域名“zh.wikipedia.org”,但不少条目都写了两版本,如-{[[法国]]和[[法國]]}-(-{国↔國}-)就曾经是两不同条目;繁简名称没有区别的条目(如[[日本]])也分成两条目(日本/-{简}-,日本/-{繁}-)。这方法的好处在于:条目内部沒有繁简问题,繁体条目使用繁体字、港台詞彙;简体条目使用简体字、大陆词汇,两者互不-{干}-擾。但这种方法却大大增加了大家的工作量,因为繁简版本间很快就不同步,只能人整合繁简之差异。


最早的中文維基每條目都可能有繁简分立的兩版本。如何处理繁体简体并存,中文维基百科必须采取特殊方法,不然就只能面临繁简分家的命运,這是中文维基百科自创以来最为迫切问题之一
最早的中文維基每條目都可能有繁简分立的兩版本。如何处理繁体简体并存,中文维基百科必须采取特殊方法,不然就只能面临繁简分家的命运,這是中文维基百科自创以来迫切问题。


繁简体之间的对应关系,不是简单的一对一,而是复杂的多对多。而维基百科所面临的问题超出繁简之间的字体转换问题。由于[[中國|大陆]]、[[香港|港]][[澳門|澳]]、[[台湾]]、[[马来西亚]]、[[新加坡]]等地多年来資訊文化獨樹一幟,许多外国译名以及新生词语也有非常大的分歧。如台湾所说的“-{帛琉}-”,在大陆却是“-{帕劳}-”;大陆使用“-{打印机}-”,台湾用的却是“-{印表機}-”。如此案例,屡见不鲜,且大大地超出了英语维基百科上英美词语之间的分歧。
繁简体之间的对应关系,不是简单的一对一,而是复杂的多对多。而维基百科所面临的问题已超出繁简之间的字体转换问题。由于[[中國|大陆]]、[[香港|港]][[澳門|澳]]、[[台湾]]、[[马来西亚]]、[[新加坡]]等地多年来資訊文化獨樹一幟,许多外国译名以及新生词语也有非常大的分歧。如台湾所说的“-{帛琉}-”,在大陆却是“-{帕劳}-”;大陆使用“-{打印机}-”,台湾用的却是“-{印表機}-”。如此案例,屡见不鲜,且大大地超出了英语维基百科上英美词语之间的分歧。


中文維基百科的繁简体地區詞问题在[[User:Zhengzhu|Zhengzhu]]、[[User:Shinjiman|Shinjiman]]和许多用户的努力下,已经得到了初步解决。取消了過去的繁简分立体系,每条目只保留一版本,并通过电脑程序自动转换繁简体和地區詞。即不仅仅要处理繁体字和简体字的问题,还要处理大陆和港台之间词汇分歧问题,如“-{帕劳}-”和“-{帛琉}-”也应该实现自动转换。在以前有繁简两版本的文章现在仍然需要人手合并,但目前已經大致完成。具体请参看[[Help:中文维基百科的繁简、地区词处理#編輯一般文章時的注意事項]]。
中文維基百科的繁简体地區詞问题在[[User:Zhengzhu|Zhengzhu]]、[[User:Shinjiman|Shinjiman]]和许多用户的努力下,已经得到了初步解决。取消了過去的繁简分立体系,每条目只保留一版本,并通过电脑程序自动转换繁简体和地區詞。即不仅仅要处理繁体字和简体字的问题,还要处理大陆和港台之间词汇分歧问题,如“-{帕劳}-”和“-{帛琉}-”也应自动转换。在以前有繁简两版本的文章现在仍然需要人手合并,但目前已經大致完成。具体请参看[[Help:中文维基百科的繁简、地区词处理#編輯一般文章時的注意事項]]。


== 基本要求 ==
== 基本要求 ==
第23行: 第23行:


== 转换技术 ==
== 转换技术 ==
技术上,维基百科的字词转换共通过级来实现:其一是MediaWiki内置的转换表<span class="plainlinks">[//github.com/wikimedia/mediawiki/blob/master/includes/languages/data/ZhConversion.php ZhConversion.php]</span>,供各维基计划全域转换;其二是[[Special:前缀索引/MediaWiki:Conversiontable/|[MediaWiki:Conversiontable]]]定义的简繁和地区词转换表,供中文维基百科本地全转换;其三是各[[Wikipedia:字詞轉換處理/公共轉換組|公共转换组]],供主题领域相同和相似的条目统一转换;其四是各条目内设置[[Help:手工字词转换|手转换]],供该条目单独使用。其中,公共转换组和条目内手转换人人均可编辑,而修改本地转换表则需管理员权限,修改全域转换表需要向MediaWiki版本库提交代码。因此,如欲新增或修复全域及本地全转换,一般用户需在[[维基百科:字词转换]]提出,交由管理员协助处理。
技术上,维基百科的字词转换四层:其一是MediaWiki内置的转换表<span class="plainlinks">[//github.com/wikimedia/mediawiki/blob/master/includes/languages/data/ZhConversion.php ZhConversion.php]</span>,供各维基计划全域转换;其二是[[Special:前缀索引/MediaWiki:Conversiontable/|[MediaWiki:Conversiontable]]]定义的简繁和地区词转换表,供中文维基百科本地全转换;其三是各[[Wikipedia:字詞轉換處理/公共轉換組|公共转换组]],供主题领域相同和相似的条目统一转换;其四是各条目内设置[[Help:手工字词转换|手转换]],供该条目单独使用。其中,公共转换组和条目内手转换人人均可编辑,而修改本地转换表则需管理员权限,修改全域转换表需要向MediaWiki版本库提交代码。因此,如欲新增或修复全域及本地全转换,一般用户需在[[维基百科:字词转换]]请,交由管理员协助处理。


=== 繁簡與地區詞轉換分開 ===
=== 繁簡與地區詞轉換分開 ===
「繁簡轉換」的意義應只是字體上的轉換如簡體「-{打斗}-」會正確轉成繁體「-{打鬥}-」),而地區詞转换旨在为中国大陆、台湾、新加坡、马来西亚、香港、澳门地区的中文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡(zh-sg)与马来西亚(zh-my)的地區詞为简体中文;台湾(zh-tw)、香港(zh-hk)与澳门(zh-mo)的地區詞为繁体(正体)中文。
「繁簡轉換」的意義應只是轉換字體(如簡體「-{打斗}-」會正確轉成繁體「-{打鬥}-」),而地區詞转换旨在为中国大陆、台湾、新加坡、马来西亚、香港、澳门地区的中文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡(zh-sg)与马来西亚(zh-my)的地區詞为简体中文;台湾(zh-tw)、香港(zh-hk)与澳门(zh-mo)的地區詞为繁体(正体)中文。


目前維基系統用[[MediaWiki:Conversiontable/zh-hans|簡體轉換表]]、[[MediaWiki:Conversiontable/zh-hant|繁體轉換表]]來處理繁簡全轉換,用[[MediaWiki:Conversiontable/zh-cn|中國大陸轉換表]]、[[MediaWiki:Conversiontable/zh-hk|港澳轉換表]]、[[MediaWiki:Conversiontable/zh-sg|新馬轉換表]]、[[MediaWiki:Conversiontable/zh-tw|臺灣轉換表]]來處理地區詞全轉換。
目前維基系統用[[MediaWiki:Conversiontable/zh-hans|簡體轉換表]]、[[MediaWiki:Conversiontable/zh-hant|繁體轉換表]]來處理繁簡全轉換,用[[MediaWiki:Conversiontable/zh-cn|中國大陸轉換表]]、[[MediaWiki:Conversiontable/zh-hk|港澳轉換表]]、[[MediaWiki:Conversiontable/zh-sg|新馬轉換表]]、[[MediaWiki:Conversiontable/zh-tw|臺灣轉換表]]來處理地區詞全轉換。


原先地區詞的分歧,納入簡繁轉換全系統處理,但其後發現這樣的做法產生不少問題:
原先地區詞的分歧,納入簡繁轉換全系統處理,但其後發現這做法產生不少問題:
#地區詞與繁/簡體並無必然關係,正如「香港繁體區」的人一樣能以繁體書寫「大陸簡體區」常用的詞彙。
#地區詞與繁/簡體並無必然關係,正如「香港繁體區」的人一樣能以繁體書寫「大陸簡體區」常用的詞彙。
#維基百科的簡繁轉換系統,與其他維基姊妹計劃共用,如果簡繁轉換系統包含地區詞彙替換,可能會使其他維基的轉換不準確,例如不需要地區詞轉換的[[維基文庫]]。
#維基百科的簡繁轉換系統,與其他維基姊妹計劃共用,如果簡繁轉換系統包含地區詞彙替換,可能會使其他維基的轉換不準確,例如不需要地區詞轉換的[[維基文庫]]。
#自動轉換過程會出現一些「失誤」,如繁體「-{數位}-人士」,轉換成簡體的時候會變「-{数码}-人士」,要透過其他技術解決,造成編輯上的困難
#自動轉換過程會出現「失誤」,如繁體「-{數位}-人士」,轉簡體會變「-{数码}-人士」,要其他技術解決,難以編輯。
转换是最方便快速的转换处理方式,但也较出现过度转换的问题,基於以上各項理由:
转换是最方便快速的转换处理方式,但也较易过度转换,基於以上各項理由:
*繁簡轉換除了一些轉換後出錯的詞彙外,都應當進入全轉換中,盡可能不要手動繁簡轉換;
*繁簡轉換除了一些轉換後出錯的詞彙外,都應當進入全轉換中,盡可能不要手轉換繁簡
*而地區詞轉換,由於會對全轉換造成可能的失誤,應儘可能地用轉換實現,除了穩定和使用廣泛的地區對應詞彙,儘可能不要進入全地區轉換。
*而地區詞轉換可能會對全轉換造成失誤,應儘可能手轉換,除了穩定和使用廣泛的地區對應詞彙,儘可能不要進入全地區轉換。
即:對手動轉換,應當主要用於地區轉換,對全轉換,應當主要用於繁簡轉換。
即:對手動轉換,應當主要用於地區轉換,對全轉換,應當主要用於繁簡轉換。


== 繁简处理 ==
== 繁简处理 ==
{{main|Wikipedia:繁简处理}}
{{main|Wikipedia:繁简处理}}
用繁体或简体创建的文章,标题必须是全部为简体或繁体字,如果标题繁简混杂,如“-{中國历史}-”,那么系统将无法自动转换。
用繁体或简体创建的文章,标题必须是全部为简体或繁体字,如果标题繁简混杂,如“-{中國历史}-”,无法自动转换。


所有的簡繁轉換應當納入轉換管理(zh-hans↔zh-hant)中,遇到有繁簡體的轉換出現問題,應到[[Wikipedia:繁简体转换请求]]反映。
所有的簡繁轉換應當納入全轉換管理(zh-hans↔zh-hant),遇到有繁簡體的轉換出現問題,應到[[Wikipedia:繁简体转换请求]]反映。


對於進入全轉換後出錯的詞彙,可用以下地區詞人手轉換方式,用{{tl|NoteTA}}或相關模板在出錯頁面改正。
對於進入全轉換後出錯的詞彙,可用以下地區詞人手轉換方式,用{{tl|NoteTA}}或相關模板在出錯頁面改正。


== 地區詞处理 ==
== 地區詞处理 ==
第52行: 第52行:
== 公共转换组==
== 公共转换组==
{{main|Wikipedia:字詞轉換處理/公共轉換組}}
{{main|Wikipedia:字詞轉換處理/公共轉換組}}
对于一些主题、领域相同和相似的条目,其中需要被转换的内容大同小异,可以这些多条目要用的共同转换字词单独一个转换组。通过在页面{{NoteTA}}模板指定组名,实现该页应这一公共组的地区词转换,所有应用该公共转换组的页面都可以不用单独维护,实现同步维护的目的。公共转换组的方便程度处于全转换与全文转换之间,而过度转换程度也处于两者之间。
主题、领域相同和相似的条目,转换的内容大同小异,可以这些多条目要用的共同转换字词单独建转换组。在页面{{NoteTA}}模板指定组名,以共規則转换地区词,所有应用该公共转换组的页面都不用单独维护,達致同步维护的目的。公共转换组的方便程度处于全转换与全文转换之间,而过度转换程度也处于两者之间。


{{維基百科方針與指引}}
{{維基百科方針與指引}}

2022年11月21日 (一) 14:17的版本

字词转换
主页 讨论
轉換請求
错误修复请求
地区词候选
轉換介紹
字詞轉換處理 讨论
  繁简处理 讨论
  地区词处理 讨论
  公共轉換組 讨论
帮助文档
繁简与地区词处理 讨论
  转换原理 讨论
  手工轉換 讨论
  高级语法 讨论
  用字模式选择说明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 界面文字轉換
地区用词 地區詞模板
地区用词2 進階地區詞模板
各地中文名 地區用詞資訊框
查看 - 讨论 - 编辑 - 变动

字詞轉換處理即對繁简字、地区词的轉換处理,本頁面闡述中文維基在字詞轉換使用中的一些基本要求。

歷史

中文维基百科建立时,虽然只用一个域名“zh.wikipedia.org”,但不少条目都写了两種版本,如法国法國(国↔國)就曾经是两條不同条目;繁简名称没有区别的条目(如日本)也分成两條条目(日本/简,日本/繁)。这方法的好处在于:条目内部沒有繁简问题,繁体条目使用繁体字、港台詞彙;简体条目使用简体字、大陆词汇,两者互不干擾。但这种方法却大大增加了大家的工作量,因为繁简版本间很快就不同步,只能人手整合繁简版之差异。

最早的中文維基每條條目都可能有繁简分立的兩種版本。如何处理繁体简体并存,中文维基百科必须采取特殊方法,不然就只能面临繁简分家的命运,這是中文维基百科自创立以来的迫切问题。

繁简体之间的对应关系,不是简单的一对一,而是复杂的多对多。而维基百科所面临的问题已超出繁简之间的字体转换问题。由于大陆台湾马来西亚新加坡等地多年来資訊文化獨樹一幟,许多外国译名以及新生词语也有非常大的分歧。如台湾所说的“帛琉”,在大陆却是“帕劳”;大陆使用“打印机”,台湾用的却是“印表機”。如此案例,屡见不鲜,且大大地超出了英语维基百科上英美词语之间的分歧。

中文維基百科的繁简体地區詞问题在ZhengzhuShinjiman和许多用户的努力下,已经得到了初步解决。取消了過去的繁简分立体系,每條条目只保留一種版本,并通过电脑程序自动转换繁简体和地區詞。即不仅仅要处理繁体字和简体字的问题,还要处理大陆和港台之间词汇分歧问题,如“帕劳”和“帛琉”也应自动转换。在以前有繁简两版本的文章现在仍然需要人手合并,但目前已經大致完成。具体请参看Help:中文维基百科的繁简、地区词处理#編輯一般文章時的注意事項

基本要求

編者請不要將含有各種用字的源碼全部轉換成同一種用字,尤其不要用本百科自動轉換的結果。但是,我們鼓勵用戶在擴充簡體頁面或與中國大陸有關的頁面時,盡量也使用簡體;擴充繁體頁面或與香港、臺灣有關的頁面時,盡量也使用繁體。注意:自動轉換程式可能會輸出很多錯誤結果

转换技术

技术上,维基百科的字词转换有四层:其一是MediaWiki内置的转换表ZhConversion.php,供各维基计划全域转换;其二是[MediaWiki:Conversiontable]定义的简繁和地区词转换表,供中文维基百科本地全域转换;其三是各公共转换组,供主题领域相同和相似的条目统一转换;其四是各条目内设置人手转换,供该条目单独使用。其中,公共转换组和条目内人手转换人人均可编辑,而修改本地转换表则需管理员权限,修改全域转换表需要向MediaWiki版本库提交代码。因此,如欲新增或修复全域及本地全域转换,一般用户需在维基百科:字词转换申请,交由管理员协助处理。

繁簡與地區詞轉換分開

「繁簡轉換」的意義應只是轉換字體(如簡體「打斗」會正確轉成繁體「打鬥」),而地區詞转换旨在为中国大陆、台湾、新加坡、马来西亚、香港、澳门地区的中文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡(zh-sg)与马来西亚(zh-my)的地區詞为简体中文;台湾(zh-tw)、香港(zh-hk)与澳门(zh-mo)的地區詞为繁体(正体)中文。

目前維基系統用簡體轉換表繁體轉換表來處理繁簡全域轉換,用中國大陸轉換表港澳轉換表新馬轉換表臺灣轉換表來處理地區詞全域轉換。

原先地區詞的分歧,納入簡繁轉換全域系統處理,但其後發現這做法產生不少問題:

  1. 地區詞與繁/簡體並無必然關係,正如「香港繁體區」的人一樣能以繁體書寫「大陸簡體區」常用的詞彙。
  2. 維基百科的簡繁轉換系統,與其他維基姊妹計劃共用,如果簡繁轉換系統包含地區詞彙替換,可能會使其他維基的轉換不準確,例如不需要地區詞轉換的維基文庫
  3. 自動轉換過程會出現「失誤」,如繁體「數位人士」,轉簡體會變「数码人士」,要以其他技術解決,難以編輯。

全域转换是最方便快速的转换处理方式,但也较易过度转换,基於以上各項理由:

  • 繁簡轉換除了一些轉換後出錯的詞彙外,都應當進入全域轉換中,盡可能不要人手轉換繁簡;
  • 而地區詞轉換可能會對全域轉換造成失誤,應儘可能人手轉換,除了穩定和使用廣泛的地區對應詞彙,儘可能不要進入全域地區轉換。

即:對手動轉換,應當主要用於地區轉換,對全域轉換,應當主要用於繁簡轉換。

繁简处理

用繁体或简体创建的文章,标题必须是全部为简体或繁体字,如果标题繁简混杂,如“中國历史”,則无法自动转换。

所有的簡繁轉換應當納入全域轉換管理(zh-hans↔zh-hant),遇到有繁簡體的轉換出現問題,應到Wikipedia:繁简体转换请求反映。

對於進入全域轉換後出錯的詞彙,可用以下地區詞人手轉換方式,用{{NoteTA}}或相關模板在出錯頁面改正。

地區詞处理

公共转换组

在主题、领域相同和相似的条目,須转换的内容大同小异,可以為这些多條条目要用的共同转换字词单独建立转换组。在页面模板指定组名,以共用規則转换地区词,所有应用该公共转换组的页面都不用单独维护,達致同步维护的目的。公共转换组的方便程度处于全域转换与全文转换之间,而过度转换程度也处于两者之间。