KONWERT(1) Podrêcznik u¿ytkownika Linuxa KONWERT(1)

konwert - interfejs do ró¿nych konwersji kodowañ znaków

konwert FILTR [PLIK]... [-o WYNIK | -O]

Konwert pozwala filtrowaæ wiele plików przez wiele filtrów. Filtruje podane PLIKI, albo stdin je¶li ¿adnych nie okre¶lono.

Prosty FILTR jest nazw± pliku wykonywalnego z katalogu ~/.konwert/filters albo z ogólnosystemowego, normalnie /usr/share/konwert/filters. Taki program sam filtruje stdin na stdout.

Regu³a filtrowania mo¿e byæ bradziej skomplikowana:

konwert FILTR1+FILTR2 znaczy konwert FILTR1 | konwert FILTR2.

konwert FORMAT1-FORMAT2, o ile taki filtr nie istnieje, próbuje znale¼æ wspólny FORMAT3, taki ¿e oba filtry FORMAT1-FORMAT3 i FORMAT3-FORMAT1 istniej±.

konwert FILTR/ARG/... przekazuje filtrowi argumenty. Argumenty mog± byæ te¿ podane tutaj: FORMAT1/ARG-FORMAT2. Znaczenie arguentów zale¿y od konkretnego filtru.

konwert '(KOMENDA ARG...)' wykonuje dane polecenie pow³oki. Jest to przydatne z opcjami -o albo -O. Komenda nie mo¿e zawieraæ ³añcucha )+, który zakoñczy specyfikacjê tego filtru.

wyj¶cie idzie do tego pliku/katalogu zamiast na stdout
ka¿dy plik ¼ród³owy jest zastêpowany swoim t³umaczeniem
wy¶wietla opis i wychodzi
wy¶wietla informacjê o wersji i wychodzi

Przekierowanie wyj¶cia do jednego z plików ¼ród³owych przez -o albo > zamiast -O zniszczy ten plik! Opcja -O tworzy tymczasowy plik w /tmp i pó¼niej kopiuje go z powrotem na ¼ród³o.

Mo¿na konwertowaæ tekst miêdzy dowolnymi dwoma zestawami znaków, na przyk³ad konwert cp437-iso2.

Znaki niedostêpne w docelowym zestawie bêd± zast±pione przybli¿eniami dostêpnymi znakami. Przybli¿enia nie musz± byæ pojedynczymi znakami.

Filtry obs³uguj± teraz nastêpuj±ce zestawy znaków:

siedmiobitowe ASCII
Unikod (Unicode) w UTF-8
iso1 = isolatin1
ISO-8859-1 albo ISO Latin 1 (zachodnioeuropejskie)
ISO-8859-2 albo ISO Latin 2 (¶rodkowoeuropejskie)
ISO-8859-3 albo ISO Latin 3 (Esperanto)
ISO-8859-4 albo ISO Latin 4 (ba³tyckie)
ISO-8859-5 (cyrylica)
ISO-8859-6 (arabskie)
ISO-8859-7 (greckie)
ISO-8859-8 (hebrajskie)
ISO-8859-9 albo ISO Latin 5 (tureckie)
ISO-8859-10 albo ISO Latin 6 (nordyckie)
ISO-8859-12 albo ISO Latin 6 (celtyckie) - Draft
ISO-8859-13 albo ISO Latin 6 (ba³tyckie) - Draft
ISO-8859-14 albo ISO Latin 6 (Sámi) - Draft
ISO-8859-15 - Draft
koi8r
KOI8-R (rosyjskie)
KOI8-U (ukraiñskie, bia³oruskie)
KOI8-Uni (cyrylica)
cp1250 = wince = winlatin2
Windows CP-1250 albo Win Latin 2 (¶rodkowoeuropejskie)
Windows CP-1251 (cyrylica)
Windows CP-1252 albo Win Latin 1 (zachodnioeuropejskie)
Windows CP-1253 (greckie)
Windows CP-1254 (tureckie)
Windows CP-1255 (hebrajskie)
Windows CP-1256 (arabskie)
Windows CP-1257 (ba³tytckie)
Windows CP-1258 (wietnamskie)
cp437 = icmeng
DOS CP-437 (angielskie)
DOS CP-737 (greckie)
DOS CP-775 (ba³tyckie)
DOS CP-850 aka DOS Latin 1 (zachodnioeuropejskie)
DOS CP-852 aka DOS Latin 2 (¶rodkowoeuropejskie)
DOS CP-855 (cyrylica)
DOS CP-857 (tureckie)
DOS CP-860 (portugalskie)
DOS CP-861 (islandzkie)
DOS CP-862 (hebrajskie)
DOS CP-863 (kanadyjskie - francuskie)
DOS CP-864 (arabskie)
DOS CP-865 (nordyckie)
DOS CP-866 (rosyjskie)
DOS CP-869 (greckie 2)
DOS CP-874 (tajskie)
mac
Macintosh Roman (zachodnioeuropejskie)
Macintosh Central European (wschodnioeuropejskie)
Macintosh Cyrillic (cyrylica)
Macintosh Greek (greckie)
Macintosh Icelandic (islandzkie)
Macintosh Turkish (tureckie)
csk,
DOSowe zestawy znaków do polskiego
amigapl,
Amigowe zestawy znaków do polskiego
DOSowy zestaw znaków do czeskiego i s¥owackiego
WinGreek (kodowanie dla staro¿ytnej greki wed³ug windowsowego fontu)
babelpl
TeX [polish]{babel}: "a"c"e"l"n"o"s"z"r
TeX \prefixing: /a/c/e/l/n/o/s/x/z
xmetodo
Esperanto: cx gx hx jx sx ux (vx w)
Esperanto: ch gh hh jh sh u
Esperanto: ^c ^g ^h ^j ^s ^u (~u)
Esperanto: c^ g^ h^ j^ s^ u^ (u~)
Esperanto: c' g' h' j' s' u'
Esperanto: c` g` h` j` s` u`
VISCII (wietnamski)
Vietnamese Quoted Readable Implicit
htmldec
SGMLowe/HTMLowe numery znaków (dziesi±tkowo): Æ ě →
SGMLowe/HTMLowe numery znaków (szesnastkowo) Æ ě →
SGMLowe/HTMLowe encje (nazwy znaków): Æ &ecaron →
Wszystkie trzy powy¿ej (tylko jako format wej¶ciowy)
TeX wraz z niektórymi rozszerzeniami LaTeXa albo AMS-TeXa. Nie ma rozró¿nienia miêdzy normalnym trybem a matematycznym - prawdopodobbie bêdziesz musia³ rêcznie podostawiaæ trochê znaków $.
mnemonic
Mnemoniki RFC 1345 poprzedzone przez &
Mnemoniki RFC 1345 poprzedzone przez `
Ten specjalny format wej¶ciowy rozpozna kodowanie automatycznie, na podstawie czêsto¶ci znaków znalezionych w tek¶cie. Z ka¿dym jêzykiem jest skojarzony zbiór mo¿liwych kodowañ u¿ywanych dla niego i ¶rednie czêsto¶ci jego liter (wy³±czaj±c litery ASCII). U¿yte zostanie najlepiej pasuj±ce kodowanie. Filtr obs³uguje teraz jêzyki cs (czeski), de (niemiecki), el (grecki), eo (Esperanto), es (hiszpañski), fr (francuski), he (hebrajski), it (w³oski), pl (polski), pt (portugalski), ru (rosyjski) i sv (szwedzki).
Wymieszane polskie ISO-8859-2, CP-1250 i UTF-8. W polskich warunkach sugerujê podpiêcie tego jako filtr w czytniku newsów (dla szybko¶ci lepiej wo³aæ bezpo¶rednio, a nie przez konwerta).
Wymieszane ró¿ne kodowania Esperanta.

/1 (np. konwert iso2-ascii/1)
Ka¿dy niedostêpny znak bêdzie zast±piony przez pojedynczy przybli¿aj±cy znak, a nie przez napis. Przydatne dla programu filterm albo dla preformatowanego tekstu. Ta opcja jest automatycznie w³±czana je¶li filtr jest u¿ywany jako wyj¶cie filterma.
/html
Zak³ada, ¿e tekst jest HTMLem. Znaki " & < > wynik³e z przybli¿eñ innych znaków bêd± prawid³owo wyeskejpowane do &quot; &amp; &lt; &gt;. Nag³ówek <META http-equiv="content-type" content="text/html; charset=..."> bêdzie poprawiony je¶li wyst±pi.
/htmldec
Konwertuje META jak wy¿ej. Niedostêpne znaki bêd± zakodowane w &#Unikodzie;.
/htmlhex
Konwertuje META jak wy¿ej. Niedostêpne znaki bêd± zakodowane w szesnastkowym &#xUnikodzie;.
/tex
Niedostêpne znaki bêd± opisane w TeXu. Znaki # $ % &  ^ _ { | } ~ wynik³e z przybli¿eñ niektórych znaków bêd± prawid³owo wyeskejpowane do \# \% \& $\backslash$ \^{} \_ \{ $|$ \} \\~{}.
/asciichar
Rozpoznaje niektóre reprezentacje znaków w ASCII, np. (c) ... 1/2 >=.
/rosyjski
Rosyjski tekst bêdzie oddany w polskiej transkrypcji fonetycznej.

Niektóre filtry wyj¶ciowe mog± u¿yæ informacji o jêzyku do lepszego przybli¿enia niedostêpnych liter, np. w /de (niemieckim): äae zamiast a.

Rozpoznaje kodowanie, ale zamiast konwersji tekstu pokazuje tylko nazwê kodowania. Dodatkowa opcja /all pokazuje wszystkie mo¿liwe kodowania, posortowane od lepszych do gorszych.
cr
Wymusza okre¶lon± konwencjê oznaczenia koñców linii. cr = Macintosh, lf = Unix i Amiga, crlf = Windows i DOS. Konwencja wej¶ciowa jest rozpoznawana automatycznie.
Rozwija tabulacje na spacje (u¿ywa programu expand z textutils).
Kompresuje spacje na pocz±tku linii do tabulacji (u¿ywa programu unexpand z textutils).
Usuwa spacje i tabulacje z koñców linii.
qp-8bit
8bit-qp
Kodowanie MIME Quoted Printable: =A3=F3d=BC.
rtf-8bit
8bit-rtf
Rich Text Format: \\'a3\\'f3d\\'9f.
Eskejpuje " & < > w SGMLowe/HTMLowe encje &quot; &amp; &lt; &gt;. Wygodne do w³±czania pliku tekstowego w HTMLowych tagach <PRE> </PRE>.
W drug± stronê.
Gb wrfg qrzbafgenpwn ebg13.
toupper
Zamienia tekst na du¿e / ma³e litery. Na razie tylko ASCII.
Konwertuje polskie znaki na sekwencje sterujêce drukarki zgodnej z EPSON wykorzystuj±c jedynie podstawowe znaki 7-bitowe, cofaj±c g³owicê drukarki i drukuj±c na odpowiedniej wysoko¶ci ,.'` daj±ce w sumie pseudo- polskie znaki. Przyjmuje opcje: /nlq (domy¶lne) optymalizowane do drukarek o lepszej rozdzielczo¶ci i /draft - np. dla trybu draft 9-ig³ówki.

/usr/share/konwert/filters/*
~/.konwert/filters/*

trs(1), filterm(1)

Znak APPLE i zestawach mac* oraz znaki CH i ch w koi8cs nie s± zachowywane przy konwersji nawet kiedy s± dostêpne. Równie¿ nie przestrzegaj± opcji /1. Powód: nie ma ich w Unikodzie.

Konwert jest pakietem s³u¿±cym do konwersji miêdzy ró¿nymi kodowaniami znaków.

Copyright (c) 1998 Marcin 'Qrczak' Kowalczyk

Niniejszy program jest oprogramowaniem wolnodostêpnym; mo¿esz go rozprowadzaæ dalej i/lub modyfikowaæ na warunkach Powszechnej Licencji Publicznej GNU, wydanej przez Fundacjê Wolnodostêpnego Oprogramowania - wed³ug wersji 2-giej tej Licencji lub której¶ z pó¼niejszych wersji.

Niniejszy program rozpowszechniany jest z nadziej±, i¿ bêdzie on u¿yteczny - jednak BEZ JAKIEJKOLWIEK GWARANCJI, nawet domy¶lnej gwarancji PRZYDATNO¦CI HANDLOWEJ albo PRZYDATNO¦CI DO OKRE¦LONYCH ZASTOSOWAÑ. W celu uzyskania bli¿szych informacji - Powszechna Licencja Publiczna GNU.

Z pewno¶ci± wraz z niniejszym programem otrzyma³e¶ te¿ egzemplarz Powszechnej Licencji Publicznej GNU; je¶li nie - napisz do Free Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA

 __("<   Marcin Kowalczyk * qrczak@knm.org.pl http://qrczak.home.ml.org/
 \__/       GCS/M d- s+:-- a21 C+++>+++$ UL++>++++$ P+++ L++>++++$ E->++
  ^^                W++ N+++ o? K? w(---) O? M- V? PS-- PE++ Y? PGP->+ t
QRCZAK                  5? X- R tv-- b+>++ DI D- G+ e>++++ h! r--%>++ y-
30 Jul 1998 Konwert