Wikipedia:地区词处理:修订间差异

维基百科,自由的百科全书
删除的内容 添加的内容
→‎全局转换:​ 更新連結
修飾語句
(未显示同一用户的1个中间版本)
第3行: 第3行:
{{字詞轉換索引}}
{{字詞轉換索引}}


在[[中文维基百科]]裡,'''地區詞处理'''和[[Wikipedia:繁简处理|繁简处理]]是[[Wikipedia:字词转换处理|字词转换系统]]的两大组成分。地區詞转换旨在为中国大陆、香港、澳门、新加坡、马来西亚、台湾的中文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡(zh-sg)及马来西亚(zh-my)的地區詞为简体中文;台湾(zh-tw)、香港(zh-hk)澳门(zh-mo)的地區詞为繁体(正體中文。
'''地區詞处理'''和[[Wikipedia:繁简处理|繁简处理]]是[[中文维基百科]][[Wikipedia:字词转换处理|字词转换系统]]的两大部份,地區詞转换旨在为中国大陆、香港、澳门、台湾、新加坡、马来西亚的中文用户提供贴近其语言习惯的转换模式。中国大陆(zh-cn)、新加坡(zh-sg)及马来西亚(zh-my)的地區詞为简体中文;台湾(zh-tw)、香港(zh-hk)澳门(zh-mo)的地區詞为正體/繁體中文。


== 修改歷程 ==
== 修改歷程 ==
第19行: 第19行:


== 全局转换 ==
== 全局转换 ==
地区词的全局转换总共通过五转换表来实现:分别是MediaWiki<span class="plainlinks">[https://phabricator.wikimedia.org/source/mediawiki/browse/master/includes/languages/data/ZhConversion.php 内置转换表]</span>、[[MediaWiki:Conversiontable/zh-cn|大陆简体转换表]]、[[MediaWiki:Conversiontable/zh-tw|台湾正体转换表]]、[[Mediawiki:Conversiontable/zh-hk|港澳繁体转换表]]和[[Mediawiki:Conversiontable/zh-sg|新马简体转换表]]。
地区词的全局转换总共通过五转换表来实现:分别是MediaWiki<span class="plainlinks">[https://phabricator.wikimedia.org/source/mediawiki/browse/master/includes/languages/data/ZhConversion.php 内置转换表]</span>、[[MediaWiki:Conversiontable/zh-cn|大陆简体转换表]]、[[MediaWiki:Conversiontable/zh-tw|台湾正体转换表]]、[[Mediawiki:Conversiontable/zh-hk|港澳繁体转换表]]和[[Mediawiki:Conversiontable/zh-sg|新马简体转换表]]。


全局转换是最方便快速的转换处理方式,但也较出现过度转换的问题。为了避免过度转换造成的错误,除了稳定和使用广泛的地区对应词汇(判定依据见下方的先决条件),维基百科一般不接受其他情况的全局地区转换。
全局转换是最方便快速的转换处理方式,但也较易过度转换。为了避免过度转换造成的错误,除了稳定和使用广泛的地区对应词汇(判定依据见下方的先决条件),维基百科一般不接受其他情况的全局地区转换。


对于地区词的全局转换,维基百科特别设立了一个[[Wikipedia:字词转换/地区词候选|字词转换/地区词候选]]面,在该页面中,用户可根据需求并在符合后文列出的先决条件情况下提交希望加入全局转换的地區詞通过社群投票产生共识,再由管理员加相应转换页面
对于地区词的全局转换,维基百科特别设立了[[Wikipedia:字词转换/地区词候选|字词转换地区词候选]]页,用户可根据需求在该页面并在符合后文列出的先决条件情况下提交希望加入全局转换的地區詞社群投票产生共识,再由管理员加相应转换页面。


判断投票通过的一般依据是:在7时间里,总共获得6名具备投票资格的维基人支持,且反对票数不超过总票数的三分之一。
判断投票通过的一般依据是:7共获得6名投票资格的维基人支持,且反对票数不超过总票数的三分之一。


以下为提请加入全局地区词转换的先决条件(申请删除全局地区词转换没有这样的限制,提报位置见下):
以下为提请加入全局地区词转换的先决条件(申请删除全局地区词转换没有这限制,提报位置见下):


#被转换词为单字转换绝不能出现在全局转换如“<nowiki>宏=>巨集</nowiki>”的转换;
#单字转换绝不能出现在全局转换,如“<nowiki>宏巨集</nowiki>”;
#进行全局转换的被转换词必须至少在100篇条目中出现(可通过引擎判断);
#请全局转换的词必须至少在100篇条目中出现(可引擎判断);


此外,转换字数较少(不于三字)的转换,社群在投票过程中还应考虑其中汉字的字频,以及可能导致过度转换的可能性。
此外,如欲转换字数较少(不于三字)的,社群在投票过程中还应考虑其中汉字的字频,以及可能导致过度转换的可能性。


关于汉字字频方面的研究,可参考[http://lingua.mtsu.edu/chinese-computing/statistics/char/list.php?Which=TO 汉字单字字频总表]、[http://lingua.mtsu.edu/chinese-computing/statistics/char/listchangyong.php 现代汉语常用字表]与[http://lingua.mtsu.edu/chinese-computing/statistics/ 其他相关统计]。
关于汉字字频方面的研究,可参考[http://lingua.mtsu.edu/chinese-computing/statistics/char/list.php?Which=TO 汉字单字字频总表]、[http://lingua.mtsu.edu/chinese-computing/statistics/char/listchangyong.php 现代汉语常用字表]与[http://lingua.mtsu.edu/chinese-computing/statistics/ 其他相关统计]。


如果您发现地区词过度转换错误,请前往[[Wikipedia:字词全局转换修复请求]]提报。
如果您发现地区词过度转换错误,请[[Wikipedia:字词全局转换修复请求]]提报。


== 全文转换 ==
== 全文转换 ==
全文转换适用于特定的单条目,有极强的针对性。
全文转换适用于特定的单条目,针对性极强


“<nowiki>-{A|</nowiki>转换内容<nowiki>}-</nowiki>”是全文转换的源代码实现,但这一方式实现的全文转换往往会导致转换代码与条目正文的代码混淆不清,不利于进行维护。因此,维基百科推荐内嵌全文转换的{{tl|NoteTA}}模版来作为实现全文转换的方式。要使用这一模版实现该功能,只需在特定条目源代码的顶端插入“<code>{{tl|NoteTA}}</code>”的模版,并依照该模版页面的说明输入转换内容即可。
“<nowiki>-{A|</nowiki>转换内容<nowiki>}-</nowiki>”是全文转换的源代码实现,但这一方式实现的全文转换往往会导致转换代码与条目正文的代码混淆不清,不利维护。因此,维基百科推荐内嵌全文转换的{{tl|NoteTA}}模版来作为实现全文转换的方式。要使用这一模版实现该功能,只需在特定条目源代码的顶端插入“<code>{{tl|NoteTA}}</code>”的模版,并依照该模版页面的说明输入转换内容即可。


由于全文转换的针对性极强,所以较难出现过度转换的情况。但有些情况也需要利用单独转换来实现。
由于全文转换的针对性极强,所以较难出现过度转换。但有些情况也需要利用单独转换来实现。


== 公共组转换 ==
== 公共组转换 ==


对于一些主题、领域相同和相似的条目,其中转换的内容大同小异,可以把這些多个条目中要用到的共同轉換字詞單獨建立一個[[Wikipedia:字詞轉換處理/公共轉換組|公共轉換組]]。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。
对于一些主题、领域相同和相似的条目,其中要转换的内容大同小异,可以把這些多个条目中要用到的共同轉換字詞單獨建立一個[[Wikipedia:字詞轉換處理/公共轉換組|公共轉換組]]。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。


建立一公共轉換組時,要依據這一組大多數詞彙在多條目中轉換的可能性,而不應依據轉換詞的類別。比如,各國現任領導人的姓名轉換,存在複用的可能性非常低,就不應當建立這類別的公共組。建立公共轉換組的方法可參見[[Wikipedia:字詞轉換處理/公共轉換組]]
建立一公共轉換組時,要依據這一組大多數詞彙在多條目中轉換的可能性,而不應依據轉換詞的類別。比如,各國現任領導人的姓名轉換,存在複用的可能性非常低,就不應當建立這類別的公共組。建立公共轉換組的方法可參見[[Wikipedia:字詞轉換處理/公共轉換組|Wikipedia:字詞轉換處理/公共轉換組]]。


公共组转换中的转换内容可由普通用户控制,而它所影响到的范围也没有全局转换这么大。公共组转换甚至可以用来填补在全局转换中受限制的二字转换。一个典型的例子是“<nowiki>數位=>数码</nowiki>”的转换:对于全局转换来说,在非电脑和信息技术关的条目中,“<nowiki>數位</nowiki>”极有可能会搭配“人士”组成“<nowiki>數位人士</nowiki>”一词,这样便导致“<nowiki>数码人士</nowiki>”的过度转换结果产生。然而,在[[Portal:資訊科技|电脑和信息技术]]的公共组转换中,所涉及到的条目大多是技术类型的条目,其中有许多本来就应该转换的“<nowiki>數位</nowiki>”词语,同时,技术性的内容也导致“<nowiki>數位人士</nowiki>”的用法几乎不会出现。
公共组转换中的转换内容可由普通用户控制,而它所影响到的范围也没有全局转换这么大。公共组转换甚至可以用来填补在全局转换中受限制的二字转换典型的例子是“<nowiki>數位数码</nowiki>”的转换:对于全局转换来说,电脑和信息技术关的条目中,“<nowiki>數位</nowiki>”后极有可能会搭配“人士”组成“<nowiki>數位人士</nowiki>”一词,这样过度转换成“<nowiki>数码人士</nowiki>”。然而,在[[Portal:資訊科技|电脑和信息技术]]的公共组转换中,所涉及到的条目大多是技术类条目,其中有许多本来就应该转换的“<nowiki>數位</nowiki>”词语,同时,技术性的内容也导致“<nowiki>數位人士</nowiki>”的用法几乎不会出现。


然而,也正如上述所说,假如真的碰巧出现了“<nowiki>數位人士</nowiki>”,公共组转换也有其局限。过度的地区转换可以通过[[Wikipedia:繁简处理|繁简处理]]的全局转换来进行修复(详见该页面),也可以通过后文中提供的其他方式实现。
然而,也正如上述所说,假如真的碰巧出现了“<nowiki>數位人士</nowiki>”,公共组转换也有其局限。过度的地区转换可以通过[[Wikipedia:繁简处理|繁简处理]]的全局转换来修复(详见该页面),也可以通过后文中提供的其他方式实现。


== 单独转换 ==
== 单独转换 ==
第59行: 第59行:
“<nowiki>-{</nowiki>转换内容<nowiki>}-</nowiki>”或“避免过度<nowiki>-{</nowiki><nowiki>}-</nowiki>转换内容”是单独转换的源代码实现。单独转换可以用于避免特定的过度转换,或者实现其他的一些特殊功能。
“<nowiki>-{</nowiki>转换内容<nowiki>}-</nowiki>”或“避免过度<nowiki>-{</nowiki><nowiki>}-</nowiki>转换内容”是单独转换的源代码实现。单独转换可以用于避免特定的过度转换,或者实现其他的一些特殊功能。


举例而言,条目[[艾奥瓦州]]中,单独转换“<code><nowiki>又譯作'''-{zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''</nowiki></code>”可以用于别名的展示。其展示的结果便是“又譯作'''-{zh:爱荷华州;zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''”。或者,使用「{{tl|各地中文名}}」等模板,說明之間差異。
举例而言,条目[[艾奥瓦州]]单独转换“<code><nowiki>又譯作'''-{zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''</nowiki></code>”可以用于别名的展示。其展示的结果便是“又譯作'''-{zh:爱荷华州;zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''”。或者用「{{tl|各地中文名}}」等模板,說明之間差異。


又举例说明避免特定的过度转换:上文所述的“<nowiki>數位人士</nowiki>”,在存在“<nowiki>數位=>数码</nowiki>”转换的同时可通过“<nowiki>數-{}-位人士</nowiki>”来避免过度转换。
又举例说明避免特定的过度转换:上文所述的“<nowiki>數位人士</nowiki>”,在存在“<nowiki>數位数码</nowiki>”转换的同时可通过“<nowiki>數-{}-位人士</nowiki>”来避免过度转换。


== 注意事项 ==
== 注意事项 ==
第75行: 第75行:


=== 参考文献应避免情况 ===
=== 参考文献应避免情况 ===
此外,参考文献的文字不应进行繁简转换(非中文的标题、姓名、引文等内容的中文翻譯除外)。因此,如果在参考文献中不进行避免繁简转换的处理,则无论是在全局转换、主题转换还是全文转换中,都有可能会对其文字造成影响。为避免此类现象发生,<u>请在引用参考文献时使用可防止繁简转换的{{tl|cite}}系列模板</u>。
此外,参考文献的文字不应转换繁简(非中文的标题、姓名、引文等内容的中譯除外),因此,如果在参考文献停用繁简转换,则无论是在全局转换、主题转换还是全文转换中,都有可能会影响當中文字。为避免此类现象发生,<u>请在引用参考文献时使用可停用繁简转换的{{tl|cite}}系列模板</u>。


=== 官方中文名稱處理 ===
=== 官方中文名稱處理 ===
{{See also|Wikipedia:命名常规#名从主人}}
{{See also|Wikipedia:命名常规#名从主人}}


當一個機構或人物已有官方的漢字或中文名時,社群對應否進行地區詞轉換出現分歧。根據[https://zh.wikipedia.org/w/index.php?title=Wikipedia:%E4%BA%92%E5%8A%A9%E5%AE%A2%E6%A0%88/%E6%96%B9%E9%92%88&oldid=49776833#%E3%80%8A%E5%91%BD%E5%90%8D%E5%B8%B8%E8%A6%8F%E3%80%8B%E8%88%87%E3%80%8A%E5%9C%B0%E5%8D%80%E8%A9%9E%E8%BD%89%E6%8F%9B%E3%80%8B 討論結果],临时解决方案為:条目名遵从“名从主人”原则,使用条目描述事物(人、物、事件等)所在地的最常用用法(如新马简体版本-{马哈迪}-);但其他地区语言版本依然显示该地区的最常用用法(如大陆简体版本-{马哈蒂尔}-),在内文以“地区词转换”方式显示名称(注:此方案不反对在文中个别地方标明条目描述事物在其他地区的名称)。
當一個機構或人物已有官方的漢字或中文名時,社群對應否轉換地區詞出現分歧。根據[https://zh.wikipedia.org/w/index.php?title=Wikipedia:%E4%BA%92%E5%8A%A9%E5%AE%A2%E6%A0%88/%E6%96%B9%E9%92%88&oldid=49776833#%E3%80%8A%E5%91%BD%E5%90%8D%E5%B8%B8%E8%A6%8F%E3%80%8B%E8%88%87%E3%80%8A%E5%9C%B0%E5%8D%80%E8%A9%9E%E8%BD%89%E6%8F%9B%E3%80%8B 討論結果],临时解决方案為:条目名遵从“名从主人”原则,使用条目描述事物(人、物、事件等)所在地的最常用用法(如新马简体版本-{马哈迪}-);但其他地区语言版本依然显示该地区的最常用用法(如大陆简体版本-{马哈蒂尔}-),在内文以“地区词转换”方式显示名称(注:此方案不反对在文中个别地方标明条目描述事物在其他地区的名称)。


{{維基百科方針與指引}}
{{維基百科方針與指引}}

2022年11月4日 (五) 19:12的版本

字词转换
主页 讨论
轉換請求
错误修复请求
地区词候选
轉換介紹
字詞轉換處理 讨论
  繁简处理 讨论
  地区词处理 讨论
  公共轉換組 讨论
帮助文档
繁简与地区词处理 讨论
  转换原理 讨论
  手工轉換 讨论
  高级语法 讨论
  用字模式选择说明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 界面文字轉換
地区用词 地區詞模板
地区用词2 進階地區詞模板
各地中文名 地區用詞資訊框
查看 - 讨论 - 编辑 - 变动

地區詞处理繁简处理中文维基百科字词转换系统的两大部份,地區詞转换旨在为中国大陆、香港、澳门、台湾、新加坡、马来西亚的中文用户提供贴近其语言习惯的转换模式。中国大陆(zh-cn)、新加坡(zh-sg)及马来西亚(zh-my)的地區詞为简体中文;台湾(zh-tw)、香港(zh-hk)及澳门(zh-mo)的地區詞为正體/繁體中文。

修改歷程

  • 港澳繁體:原以zh-hk參數涵蓋zh-mo,社群於2013年討論後,正式啟用zh-mo參數,拆分「香港繁體」和「澳門繁體」。
  • 馬新簡體:原以zh-sg參數涵蓋zh-my,而在2018年經過社群討論後,正式啟用zh-my參數,拆分「新加坡簡體」和「大馬簡體」。

轉換涵蓋順序

  • 中文:zh兼容zh-hans、zh-hant
  • 簡體:zh-hans zh-cn ⊃ zh-sg ⊃ zh-my
  • 繁體:zh-hant ⊃ zh-tw ⊃ zh-hk ⊃ zh-mo

因此若順位較低的地區詞與上一順位者相同,擇該上位者涵蓋即可。zh雖兼容zh-hans、zh-hant直接取代,但下位區域轉換不影響。

全局转换

地区词的全局转换总共通过五張转换表来实现:分别是MediaWiki内置转换表大陆简体转换表台湾正体转换表港澳繁体转换表新马简体转换表

全局转换是最方便快速的转换处理方式,但也较易过度转换。为了避免过度转换造成的错误,除了稳定和使用广泛的地区对应词汇(判定依据见下方的先决条件),维基百科一般不接受其他情况的全局地区转换。

对于地区词的全局转换,维基百科特别设立了字词转换/地区词候选页,用户可根据需求在该页面并在符合后文列出的先决条件之情况下提交希望加入全局转换的地區詞,并以社群投票产生共识,再由管理员加到相应转换页面。

判断投票通过的一般依据是:7天內共获得6名有投票资格的维基人支持,且反对票数不超过总票数的三分之一。

以下为提请加入全局地区词转换的先决条件(申请删除全局地区词转换没有这限制,提报位置见下):

  1. 单字转换绝不能出现在全局转换,如“宏→巨集”;
  2. 申请全局转换的词必须至少在100篇条目中出现(可用搜尋引擎判断);

此外,如欲转换字数较少(不多于三字)的词,社群在投票过程中还应考虑其中汉字的字频,以及可能导致过度转换的可能性。

关于汉字字频方面的研究,可参考汉字单字字频总表现代汉语常用字表其他相关统计

如果您发现地区词过度转换错误,请在Wikipedia:字词全局转换修复请求提报。

全文转换

全文转换适用于特定的单篇条目,针对性极强。

“-{A|转换内容}-”是全文转换的源代码实现,但这一方式实现的全文转换往往会导致转换代码与条目正文的代码混淆不清,不利维护。因此,维基百科推荐内嵌全文转换的{{NoteTA}}模版来作为实现全文转换的方式。要使用这一模版实现该功能,只需在特定条目源代码的顶端插入“{{NoteTA}}”的模版,并依照该模版页面的说明输入转换内容即可。

由于全文转换的针对性极强,所以较难出现过度转换。但有些情况也需要利用单独转换来实现。

公共组转换

对于一些主题、领域相同和相似的条目,其中要转换的内容大同小异,可以把這些多个条目中要用到的共同轉換字詞單獨建立一個公共轉換組。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。

建立一組公共轉換組時,要依據這一組大多數詞彙在多篇條目中轉換的可能性,而不應依據轉換詞的類別。比如,各國現任領導人的姓名轉換,存在複用的可能性非常低,就不應當建立這類別的公共組。建立公共轉換組的方法可參見Wikipedia:字詞轉換處理/公共轉換組

公共组转换中的转换内容可由普通用户控制,而它所影响到的范围也没有全局转换这么大。公共组转换甚至可以用来填补在全局转换中受限制的二字转换,典型的例子是“數位→数码”的转换:对于全局转换来说,與电脑和信息技术無关的条目中,“數位”后面极有可能会搭配“人士”组成“數位人士”一词,这样就会过度转换成“数码人士”。然而,在电脑和信息技术的公共组转换中,所涉及到的条目大多是技术类条目,其中有许多本来就应该转换的“數位”词语,同时,技术性的内容也导致“數位人士”的用法几乎不会出现。

然而,也正如上述所说,假如真的碰巧出现了“數位人士”,公共组转换也有其局限。过度的地区转换可以通过繁简处理的全局转换来修复(详见该页面),也可以通过后文中提供的其他方式实现。

单独转换

“-{转换内容}-”或“避免过度-{}-转换内容”是单独转换的源代码实现。单独转换可以用于避免特定的过度转换,或者实现其他的一些特殊功能。

举例而言,条目艾奥瓦州单独转换“又譯作'''-{zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''”可以用于别名的展示。其展示的结果便是“又譯作爱荷华州爱我华州衣阿華州”。或者用「{{各地中文名}}」等模板,說明之間差異。

又举例说明避免特定的过度转换:上文所述的“數位人士”,在存在“數位→数码”转换的同时可通过“數-{}-位人士”来避免过度转换。

注意事项

手动转换书写格式

概括而言:您可以只使用zh-hans与zh-hant便达到目的,也欢迎您按照推荐的格式来书写

虽然,地區詞处理只涉及zh-cn、zh-tw、zh-hk、zh-mo、zh-sg、zh-my六种模式,但出于方便实际操作的原因,并不强制要求按照何种方式填写,只要填写的转换能够满足预期的要求,并在各种模式下都不出现错误即可。

然而,上述的操作实际上并不完全符合于繁简转换与地區詞转换分立的思想。因此,这里还推荐另一种做法,即让zh-hans、zh-hant的名称保持一致,只填寫繁简體對應詞,不要填寫對應地區詞。對A轉換采用哪一地區詞先到先得(即先編輯轉換的),對於T轉換,要求除繁簡之別外與標題一致。这一做法并不要求所有的编者都要掌握,因此不会对第一种简便做法填写造成任何妨碍,了解第二种做法的编者会逐渐地将第一种做法修正。

参考文献应避免情况

此外,参考文献的文字不应转换繁简(非中文的标题、姓名、引文等内容的中譯除外),因此,如果不在参考文献停用繁简转换,则无论是在全局转换、主题转换还是全文转换中,都有可能会影响當中文字。为避免此类现象发生,请在引用参考文献时使用可停用繁简转换的{{cite}}系列模板

官方中文名稱處理

當一個機構或人物已有官方的漢字或中文名時,社群對應否轉換地區詞出現分歧。根據討論結果,临时解决方案為:条目名遵从“名从主人”原则,使用条目描述事物(人、物、事件等)所在地的最常用用法(如新马简体版本马哈迪);但其他地区语言版本依然显示该地区的最常用用法(如大陆简体版本马哈蒂尔),在内文以“地区词转换”方式显示名称(注:此方案不反对在文中个别地方标明条目描述事物在其他地区的名称)。