[12:39:43] <TRUE> : )
[12:40:35] <TRUE> "юникод - зло" : )
[15:05:33] <valexey> TRUE: чо ржошь?
[15:05:44] <valexey> ты когда-нибудь пробовал лексер с учетом utf8 написать?
[15:12:11] <valexey> ААА!!! Хочу новые литералы в ObjC! Хочу llvm 4.0!
[15:12:20] <valexey> А места на винте нет на обновление XCode :-(
[15:31:01] <valexey> http://stackoverflow.com/questions/9347722/apple-llvm-4-0-new-features-on-xcode-4-4-literals
[15:31:04] <valexey> ХОЧУ!
[15:37:07] <egp> valexey: я на днях писал CountingInputStreamReader
[15:37:15] <egp> для UTF-8
[15:37:35] <egp> то есть ридер явовский который байты на нижнем уровне считает
[15:38:00] <egp> и декодер UTF-8 - это несколько десятков строк всего лишь
[15:38:07] <egp> из byte в wchar
[15:38:21] <egp> только wchar надо 32-битный
[15:46:50] <egp> в яве символы юникода, которые занимают 32 бита в ютф8, кодируются двумя чарами
[16:01:03] <valexey> ну, utf8->utf32 (aka ucs-4) то написать не проблема. алсо их полно стандартных
[16:01:27] <valexey> а вот лексер-генераторов которые по человечески юникод понимали бы - нема
[16:02:15] <valexey> точнее с юникодом проблема какая? проблема в том, что например управляющие символы не сконцентрированы в каком-то диапазоне, они рассыпаны тонким слоем
[16:03:33] <kemiisto> test
[16:03:33] <Жаба> kemiisto, passed
[16:03:41] <kemiisto> >_<
[16:03:49] <kemiisto> :-)
[16:04:20] <valexey> kemiisto: вау какие люди!
[16:04:33] <kemiisto> и без охраны :D
[16:04:52] <kemiisto> я мучаю Messages из Mountain Lion
[16:04:59] <valexey> и каг?
[16:05:04] <valexey> version kemiisto
[16:05:04] <kemiisto> жаббер оно поддерживает
[16:05:05] <Жаба> valexey, kemiisto have imagent 8.0 (v900) on Mac OS X
[16:05:12] <kemiisto> а больше и не надо :D
[16:05:29] <valexey> а как оно поддерживает? топик видит? менять умеет? управление конфой?
[16:06:49] <kemiisto> нет на все три вопроса :D
[16:07:00] <kemiisto> пока не вижу, по крайней мере
[16:07:04] <valexey> НИНУЖЕН!
[16:14:15] <valexey> почитал ардуину
[16:14:21] <valexey> то есть тьюториалы
[16:14:24] <valexey> http://arduino.cc/en/Tutorial/Blink
[16:14:30] <valexey> слишком все просто
[16:14:34] <valexey> НИНУЖЕН!
[16:15:00] <kemiisto> ну бери что-нибудь под Astrobe или как его там
[16:15:02] <kemiisto> :D
[16:15:20] <valexey> kemiisto: а я уже взял.
[16:15:28] <valexey> TI Launchpad
[16:15:33] <valexey> и никаких Astrobe
[16:15:54] <valexey> обошлось в 4.3$
[16:24:24] <valexey> с доставкой из штатов
[16:49:14] <TRUE> <valexey> TRUE: чо ржошь?
[16:50:18] <TRUE> как же ж не ржать, когда от тебя только и слышишь "форум на utf8", "как к ББ прикрутить utf8" и т.д.
[16:50:32] <TRUE> а в кульминации "... - зло"
[16:51:07] <TRUE> а доставка включена в стоимость пада?
[16:52:05] <valexey> да
[16:52:44] <TRUE> а оплата как?
[16:53:00] <valexey> карточкой
[16:53:21] <TRUE> я у них на сайте в форме заказа видел, что только 3 штуки одновременно можно заказать.
[16:53:42] <TRUE> ты через эту форму заказывал?
[16:53:46] <valexey> угу.
[16:53:50] <valexey> просто я заказал два раза :-)
[16:54:11] <kemiisto> хитрый какой :D
[16:54:20] <kemiisto> сразу видно - россиянин
[16:54:26] <valexey> а то ж!
[16:54:49] <valexey> они даже россиян банили в своем магазине в июле
[16:54:55] <valexey> ибо слишком уж хитрожопые
[16:57:00] <TRUE> ого, теперь вижу, что можно за раз заказать до 20
[16:58:02] <valexey> где? как?
[16:58:58] <TRUE> https://estore.ti.com/Product3.aspx?ProductId=2031
[16:59:12] <TRUE> максимальную границу подняли
[17:01:24] <valexey> угу. причем на этой неделе. буквально на прошлой было 3 максимум
[17:03:08] <valexey> только там пока только предварительный заказ
[17:16:59] <valexey> TRUE: с другой стороны, никто не мешает реализовывать оберон не так как это было бы разумно, а так как написано у Вирта в репорте :-)
[17:18:28] <TRUE> в репорте, вроде, всё разумно. Но там не полностью
[17:19:06] <TRUE> или по-другому: предположим, что содержимое репорта это необходимое но не достаточное условие для написания компилятора
[17:20:05] <valexey> в каком месте разумно ограничение строковых литералов множеством Latin-1?
[17:21:09] <TRUE> И вправду, в каком месте?
[17:21:17] <TRUE> номер страницы
[17:23:03] <TRUE> где они вообще лежат, а то я уже порядком подзабыл содержимое
[17:25:25] <valexey> TRUE: http://www.inf.ethz.ch/personal/wirth/Articles/Oberon/Oberon.Report.pdf
[17:25:36] <valexey> The representation of symbols in terms of characters is defined using the ASCII set
[17:25:43] <TRUE> я, например, вообще против кодировок. Это атавизм для терминалов 60-х 70-х годов, когда значения символов были забиты непосредственно в железо.
[17:25:46] <TRUE> спс
[17:25:54] <valexey> первая страница :-)
[17:26:08] <valexey> TRUE: в смысле? а есть другие варианты? :-)
[17:26:24] <valexey> у чисел, вообще то, тоже есть хм… кодировки :-)
[17:27:52] <valexey> http://exaprog.com/Oberon07.Report.pdf
[17:28:01] <valexey> The representation of symbols in terms of characters is defined using the Latin-1 set.
[17:28:45] <valexey> А вот из ревизии 2011 года он убрал упоминание о чарсете вообще: http://www.inf.ethz.ch/personal/wirth/Articles/Oberon/Oberon07.Report.pdf
[17:36:18] <TRUE> а какие у чисел кодировки?
[17:37:11] <valexey> например IEEE 754
[17:38:55] <TRUE> ну здесь всё понятно. Это дело отбросить можно будет только вместе с процессором. И вообще, это не digitset
[17:39:15] <valexey> а что же? :-)
[17:39:29] <valexey> одно и то же число может быть закодировано разными способами
[17:39:39] <valexey> вчера как раз имел секс с перекодировкой чисел
[17:39:47] <TRUE> а кодировки символов нужны исключительно человеку. Для работы или управления компом они не нужны. Уже
[17:40:19] <valexey> эмм. пардон, но нужны. как ты себе представляешь лексер не учитывающий кодировку символов?
[17:40:26] <TRUE> закодировано оно может быть по-разному, но это не набор символов, зашитый в железо
[17:40:41] <TRUE> это правила представления, необходимые в вычислениях
[17:40:43] <valexey> дык и кодировка числе далеко не всегда зашито в железо
[17:41:15] <valexey> я откровенно не вижу разницы
[17:41:22] <TRUE> когда оно не зашито в железо, то без него вполне можно обойтись
[17:41:32] <TRUE> в смысле, свой формат придумать, если потребуется
[17:41:40] <valexey> как ты эти голимые числа будешь обрабатывать не зная кодировку?
[17:41:49] <valexey> числа тебе приходят извне
[17:41:54] <valexey> в некой кодировке
[17:41:57] <valexey> очевидно
[17:42:09] <TRUE> внутри системы они ходят в одной кодировке.
[17:42:34] <valexey> внутри да. но тут и с текстами проблем нет.
[17:42:40] <TRUE> то есть, если разрабатывается куча всего (ПО, железо), то вполне реально забабахать свой формат
[17:42:55] <valexey> это одинаково касается и чисел и строк
[17:43:09] <TRUE> с текстами проблема есть.
[17:43:13] <valexey> где?
[17:43:23] <TRUE> она так и звучит: проблема кодировок
[17:43:31] <valexey> у чисел та же проблема
[17:43:36] <valexey> один в один
[17:44:11] <valexey> и проблема эта возникает ТОЛЬКО в месте где соприкасаются две системы (не важно какие, может две программы, может программа и файл) которые работают с разными представлениями ЭТОГО
[17:44:24] <valexey> (то есть числа или символа, разные кодировки)
[17:44:49] <TRUE> нет. "Кодировка" числа включает весь набор чисел, способных обрабатываться процессором. И вообще, это не кодировка, а набор правил, необходимых для расчётов.
[17:44:51] <valexey> даже голимое простейшее целое число представляется уймой разных способов.
[17:45:23] <valexey> да нифига. big endian, little endian, MIDDLE endian, host order, net order
[17:45:36] <valexey> и это я еще не касался разрядности
[17:45:43] <valexey> и не касался длинных чисел
[17:45:54] <valexey> да, и все это пока банальное целое число
[17:46:14] <valexey> а если есть тонкости в представлении отрицательных чисел
[17:46:34] <valexey> читаешь ты файлик, а там кодировка чисел отлична от той которую ты ожидаешь, и все. приплыли
[17:46:45] <valexey> имеем крякозябры вместо вычислений
[18:00:47] <TRUE> всё это не digitset, а digit format. Поэтому, описанное тобой к кодировкам отношения не имеет. К кодировкам того типа, которые обычно первыми нагугливаются. Каждое число из любого предъявленного здесь тобой представления обозначает число. Точнее, не просто число, а себя же и представляет. С символьными же кодировками всё не так. Символы сами себя не представляют. Поэтому, при смене кодировки происходит ой. Аналогией может служить массив: индексы - это то, что хранится в файле и передаётся по интернету, а значения элементов массива - это и есть символы. Поменяли кодировку - индексы остались (клавиатура же не поменялась...) а символы стали другими. Какое отличие от "кодировок" чисел? Правила работы со всем этим известны, а в случае с числами именно незнание правила приводит к проблемам.
[18:09:40] <valexey> я слабо понимаю о чем ты говоришь :-) ну, либо ты с кодировками да числами на низком уровне не имел дела. возьмем ucs-2, казалось бы, каждый символ тут банальное 16ти битное число. ну, то есть прочитав эти битики (из файла) в 16ти битную переменную целого типа ты получишь вполне вменяемый индекс (номер глифа). Ан хрен. У тебя кодировка 16ти битных чисел в системе может быть отлична от кодировки 16ти битных же индексов глифов.
[18:10:44] <valexey> Один и тот же набор байт может быть проинтерпретирован по разному, в зависимости от того, как мы будем его интерпретировать. Это может быть набор целых чисел, набор чисел с плавающей точкой или же набор символов. И там и сям у нас форматы, или кодировки.
[18:50:30] <valexey> CherryJB: играла со своей собакой.. Че-то сама заигралась и куснула ее за хвост!
CherryJB: ее глаза надо было видеть: "хозяйка! Фу, блеять, фу, нельзя!!!!!"