Locale::Po4a::TransTractor(3pm) | Po4a 工具 | Locale::Po4a::TransTractor(3pm) |
Locale::Po4a::TransTractor - 通用翻译提取器。
Po4a (PO For Anything) 项目的目标是在文档等不需要翻译的领域使用 gettext 工具简化翻译(更有趣的是,简化翻译的维护)。
这个类是每个 po4a 解析器的祖先,用于解析文档、搜索可翻译字符串、将它们提取到 PO 文件并在输出文档中用它们的翻译替换它们。
更正式地说,它接受以下参数作为输入:
作为输出,它产生:
以下是这一点的图形表示:
输入文档 --\ /---> 输出文档 \ / (已翻译) +-> 解析() 函数 -----+ / \ 输入 PO --------/ \---> 输出 PO (已提取)
此函数由下面的 process() 函数调用,但如果您选择使用 new() 函数,并手动将内容添加到文档中,则必须自己调用此函数。
下面的示例解析以 "<p>" 开头的段落列表。为简单起见,我们假定文档格式良好,即 "<p>" 标记是唯一存在的标记,并且该标记位于每个段落的最开始。
sub parse { my $self = shift; PARAGRAPH: while (1) { my ($paragraph,$pararef)=("",""); my $first=1; my ($line,$lref)=$self->shiftline(); while (defined($line)) { if ($line =~ m/<p>/ && !$first--; ) { # 这不是我们第一次看到<p>。 # 将当前行重新放入输入, # 并将构建的段落输出 $self->unshiftline($line,$lref); # 现在文档已形成,请翻译它: # - 删除前导标记 $paragraph =~ s/^<p>//s; # - 按键输出前导标签(未翻译)和 # 段落的其余部分(已翻译) $self->pushline( "<p>" . $self->translate($paragraph,$pararef) ); next PARAGRAPH; } else { # 追加到段落后面 $paragraph .= $line; $pararef = $lref unless(length($pararef)); } # 重新初始化循环 ($line,$lref)=$self->shiftline(); } # 没有得到定义的行吗?输入文件的结尾。 return; } }
一旦实现了解析函数,就可以使用下一节中介绍的公共接口来使用 document 类。
参数,除了 new() 接受的参数(具有预期类型):
此数组
"@{$self->{TT}{doc_in}}"
将此输入文档数据保存为。
具有交替含义的字符串数组。
*字符串 $textline
保存输入文本数据的每一行。
*字符串
"$filename:$linenum"
保存其位置并调用为。
"reference" ("linenum"
从 1 开始)。
请注意,它不解析任何内容。当您完成将输入文件打包到文档中时,应该使用 parse() 函数。
此翻译文档数据由以下人员提供:
* "$self->docheader()"
保存插件的标题文本,以及。
* "@{$self->{TT}{doc_out}}"
保存数组中主翻译文本的每一行。
[正常使用 po4a 文档...] ($percent,$hit,$queries) = $document->stats(); print "我们找到了 $percent\% ($hit from $queries) 字符串的翻译\n";
此函数在出错时返回非空整数。
提供了四个函数来获取输入和返回输出。它们与 Perl 的 shift/unshift 和 push/pop 非常相似。
* Perl shift 返回第一个数组项并将其从数组中删除。 * Perl unshift 将项作为第一个数组项添加到数组中。 * Perl pop 返回最后一个数组项并将其从数组中删除。 * Perl push 将一项作为最后一个数组项追加到数组中。
第一对是关于输入的,第二对是关于输出的。助记符:在 input 中,您感兴趣的是第一行,shift 提供什么,而在 output 中,您希望将结果添加到末尾,就像 push 一样。
提供一个函数来处理应该翻译的文本。
此函数还可以接受一些额外的参数。它们必须组织为散列。例如:
$self->translate("string","ref","type", 'wrap' => 1);
操作:
它将使用命令行中指定的输出字符集。如果未指定该命令,则将使用输入 PO 的字符集,如果输入 PO 具有默认的 "CHARSET",则返回输入文档的字符集,以便不会执行编码。
当前翻译提取器的一个缺点是它不能处理包含所有语言的翻译文档,如 debconf 模板或 .desktop 文件。
要解决此问题,只需更改接口:
$self->pushline_all({ "Description[".$langcode."]=". $self->translate($line,$ref,$langcode) });
看看是否足够 ;)
Denis Barbier <barbier@linuxfr.org> Martin Quinson (mquinson#debian.org) Jordi Vilalta <jvprat@gmail.com>
2023-01-03 | Po4a 工具 |