?

Log in

открытие - Оживший юзерпик

Dec. 2nd, 2008

01:38 pm - открытие

Previous Entry Share Next Entry

На старости лет осознал, что iconv можно не давать -t. Осталось понять, где он берет кодировку по умолчанию (нет, это не LANG).

Comments:

[User Picture]
From:vitus_wagner
Date:December 2nd, 2008 10:49 am (UTC)
(Link)
Как не LANG? nl_langinfo(CODESET).
(Reply) (Thread)
[User Picture]
From:tobotras
Date:December 2nd, 2008 10:54 am (UTC)
(Link)
А так. env LANG=C iconv -f ... -- все равно даёт мне строчку в КОИ-8.
(Reply) (Parent) (Thread)
[User Picture]
From:vitus_wagner
Date:December 2nd, 2008 11:01 am (UTC)
(Link)
Это у тебя небось какой-нибудь LC_CTYPE где-нибудь выставлено.
У меня в Linux
echo бНОПНЯ |LANG=C iconv -f CP1251
iconv: illegal input sequence at position 0

А portable iconv (под Solaris 8)
echo бНОПНЯ |LANG=C iconv -f cp1251
iconv: conversion to char unsupported
iconv: try 'iconv -l' to get the list of supported encodings

(Reply) (Parent) (Thread)
[User Picture]
From:tobotras
Date:December 2nd, 2008 11:14 am (UTC)
(Link)
Тьфу на меня. Я сказал

env LANG=C {источник данных} | iconv

:-)
(Reply) (Parent) (Thread)
[User Picture]
From:poige
Date:December 2nd, 2008 11:11 am (UTC)

> (нет, это не LANG).

(Link)
Да, это LC_CTYPE (или LC_ALL). ;-)
(Reply) (Thread)
[User Picture]
From:tobotras
Date:December 2nd, 2008 11:15 am (UTC)

Re: > (нет, это не LANG).

(Link)
Я ещё тупее, чем ты думаешь, см. выше :)
(Reply) (Parent) (Thread)
[User Picture]
From:poige
Date:December 2nd, 2008 11:20 am (UTC)

> Я ещё тупее, чем ты думаешь, см. выше :)

(Link)
Да с кем не бывает…
(Reply) (Parent) (Thread)
From:sigterm
Date:December 2nd, 2008 11:18 am (UTC)
(Link)
Кодировку можно определить вполне надежно по статистике триграм, если текста б.м. достаточное количество. Но не думаю, что iconv это умеет :)
(Reply) (Thread)
[User Picture]
From:vitus_wagner
Date:December 2nd, 2008 12:09 pm (UTC)
(Link)
iconv не умеет даже заменять отсутствующие в выходной кодировке символы на что-то более-менее осмысленное. Хоть на вопросительный знак.
(Reply) (Parent) (Thread)
[User Picture]
From:tobotras
Date:December 2nd, 2008 12:23 pm (UTC)
(Link)
Выходную кодировку определить нельзя :-D
(Reply) (Parent) (Thread)