Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

更改多语言组织形式 #1291

Open
LiAlH4qwq opened this issue Feb 7, 2025 · 10 comments
Open

更改多语言组织形式 #1291

LiAlH4qwq opened this issue Feb 7, 2025 · 10 comments

Comments

@LiAlH4qwq
Copy link
Contributor

LiAlH4qwq commented Feb 7, 2025

我认为现在本站多语言内容组织欠妥,例如

  1. 性别重置手术板块,不是说简中用户就一定只能去一部分医院,而繁中用户只能去另一部分
  2. 证件信息变更部分,并不是说持有台湾证件就一定是繁中用户

我感觉应该变更成如下形式更好

  1. 将内容不同的内容放在不同的页面,而不是共用同一个页面,例如证件信息变更,应该分为大陆证件信息变更和台湾证件信息变更
  2. 让所有页面的语言切换器支持切换到所有支持的语言,可以默认显示机翻内容或大模型翻译内容,如果有人工翻译内容,可提供按钮供用户手动选择,并显示“内容翻译于xxx,部分信息可能过期,查看最新信息请查看原文”的提示
@Cryolitia
Copy link
Member

@LiAlH4qwq 谨复,

感谢您的建议!

站点的多语言组织形式是我们长期以来一直持续重点讨论的重点话题之一,也是本网站下一个五年计划的重构要点。

我们目前的计划是按照国家/地区划分内容,而非语言系统,您提出的方向十分正确。然而,我们不希望为所有页面同步提供所有语言的翻译,例如,为日本站提供斯瓦西里语翻译就是毫无必要的,目前讨论的主要要点是每个站点应该使用何种语言作为底版语言,如日文站应面向日本本土用户还是在日华人用户提供服务。

我个人不希望使用机翻或大模型翻译内容,目前此类网页翻译工具已足够成熟,用户可自行安装相关插件。

@Bersella-AI
Copy link
Member

请容我讲些个人见解。多语言/多区域这块,我确实同意有许多东西不仅在简中或中国大陆环境,在全球都是通用的,包括但不限于:

  • HRT 药物相关普及知识
  • 面向全球开展性别肯定手术(包括但不限于整容、性别重置手术)的国际医院相关信息
  • WPATH《跨性别和性别多元人群健康照护指南)

因此,多区域有关的核心问题可能并不在以何种文字为基石上,而是如何来界定哪些东西放在哪块部分。很明显,以上内容和多区域的设想是有所冲突的,它们在这样的 wiki 里究竟该置于何处,至今悬而未决。

就目前全球华人的文化交流趋势看,除了简、繁体和个别词汇之别以外,语言习惯正在电视剧等娱乐文化产品的潜移默化之下走向趋同1。我的观点可能更开放些:大陆、港台乃至全球,共享同一套医疗信息,简、繁之间仅有字形之分,彻底消弭二者间信息的不对称;无论读者来自何方,使用何种文字,我们都将一视同仁。事实上,本人已为此躬诸实践,在药物板块同时维护简中、繁中和日语页面;对于其他部分,因本人精力有限,尚无力触及,但本人相信,随着更多有志之士的加入,wiki 有望走向天下大同。

Footnotes

  1. 刘燕婷. 从《甄嬛传》到《繁花》,台湾人为何爱看陆剧?[EB/OL]. 观察者网, (2024-03-01). https://www.guancha.cn/LiuYanTing/2024_03_01_726782_s.shtml

@LiAlH4qwq
Copy link
Contributor Author

LiAlH4qwq commented Feb 8, 2025

简、繁之间仅有字形之分,彻底消弭二者间信息的不对称

所以或许可以对这些页面使用类似wikipedia的简繁体转换工具?不过这可能需要对hugo进行大改

@saeziae
Copy link
Member

saeziae commented Feb 8, 2025

关于删除繁中页面(现在主要指泰国srs板块)的想法主要是由于我们无力保证内容和简中同步更新,在 信息落后 与 阅读简中页面(事实上的主力维护页面)之间相信读者更偏向后者。
曾经是用opencc同步的,但是是手动运行,贡献的时候不是所有人都有装opencc以及记得同步一下

@LiAlH4qwq
Copy link
Contributor Author

关于删除繁中页面(现在主要指泰国srs板块)的想法主要是由于我们无力保证内容和简中同步更新,在 信息落后 与 阅读简中页面(事实上的主力维护页面)之间相信读者更偏向后者。 曾经是用opencc同步的,但是是手动运行,贡献的时候不是所有人都有装opencc以及记得同步一下

可否考虑使用github action自动根据简中页面生成繁中页面

@Bersella-AI
Copy link
Member

对!最核心的问题就是缺乏人手,缺乏来自其他地区、或者 有多语言能力、或者 对 OpenCC 转换结果可以人工校对的人手!Wiki 主站这头我尚且可以腾出手来校对,TFSci 那头则干脆交给九月酱写的完美 OpenCC 脚本处理了(字实在太多了)。_:(3 」∠)_

@Cryolitia
Copy link
Member

所以或许可以对这些页面使用类似wikipedia的简繁体转换工具?不过这可能需要对hugo进行大改

港台人:我们宁愿直接看简体也不想看机翻出来的一坨繁体

@Leetfs
Copy link
Member

Leetfs commented Feb 8, 2025

关于删除繁中页面(现在主要指泰国srs板块)的想法主要是由于我们无力保证内容和简中同步更新,在 信息落后 与 阅读简中页面(事实上的主力维护页面)之间相信读者更偏向后者。
曾经是用opencc同步的,但是是手动运行,贡献的时候不是所有人都有装opencc以及记得同步一下

我们或许可以使用cicd自动完成此操作,需要两个工作流

  • 构建工作流:在构建前执行opencc,确保构建出的产物永远最新。
  • 同步工作流:定期(如每月)自动运行一次并push,确保仓库内的版本不会过于落后。

@Cryolitia
Copy link
Member

Cryolitia commented Feb 8, 2025

港台人:我们宁愿直接看简体也不想看机翻出来的一坨繁体

基于这个删除繁中的机翻内容是Project Trans制作委员会2023夏季会议的决议,无需继续讨论实行的技术细节。保留开放务虚的讨论实施此操作的必要性和重要性,我个人保留允许以充足因由推翻此决议的意见。

PS: 真有时间做什么自动流水线大语言模型机翻的架构,还不如把下一个五年计划的Astro重构全站做了,顺便在重构过程中好好设计一个以后不会那么后头来骂屎山的架构。

@AnnaBeiyan
Copy link
Contributor

感觉hugo挺好的

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants