[00:00:32] <vаlexey> ну, альтернатива не сильно проще - единственная альтернатива это Ада
[00:00:39] <geniepro> kpmý: ненене! осилить прочитать этот талмуд -- херня по сравнению с осилить создать транслятор в полном соответствии с этим талмудом )))
[00:01:06] <kpmý> а потом еще и в llvm перегнать
[00:01:27] <kpmý> а на хаскель поди меньший объем
[00:01:27] <vаlexey> ну, вон Зуев знает и может :-)
[00:01:50] <vаlexey> угу. хаскель живет в своем мире. да и не соблюдает там никто стандарт особо. недостандарт точнее
[00:01:59] <geniepro> на хаскель 2010 примерно 140 или 160 страниц описание -- точно не помню
[00:02:20] <geniepro> но там без промышленных расширений
[00:02:37] <vаlexey> математика чистой воды :-)
[00:02:46] <vаlexey> дам и без мат. расширизмов ghc
[00:03:28] <geniepro> "Haskell 2010 Language Report" Simon Marlow -- матерь божья! 329 страниц оказывается )))
[00:04:10] <kpmý> пятикратный отсос у С++
[00:04:13] <geniepro> 150 страниц на сам язык, и ещё 140 на стандартную либу
[00:04:19] <vаlexey> Да ладно, на паскаль 90 года стандарт 98 страниц :-)
[00:04:38] <geniepro> ну если либу не считать то так и вышло ))) полторы сотни страниц всего )
[00:04:41] <vаlexey> при этом в плюсах две трети описалова - это описалово стандартных либ
[00:05:22] <vаlexey> так то язык страниц 400
[00:05:48] <geniepro> да, в драфте на сам язык 370 страниц отведено
[00:12:45] <vlad2> Похоже карбон будет поддерживать в последнем релизе OSX. Пошной зверек прошел мимо :)
[00:12:47] <boris_ilov> хе хе
[00:13:20] <boris_ilov> сижу пишу лексер
[00:13:29] <vlad2> На js? :)
[00:13:36] <boris_ilov> на C99
[00:13:48] <boris_ilov> стал писать по принципу BB
[00:14:08] <vаlexey> стандарт на модулу-2 -- 707 страниц :-)
[00:14:12] <vlad2> Тяжело тебе :)
[00:14:25] <boris_ilov> тык вот прикол в том что я лохонулся
[00:14:29] <vаlexey> да, на Си, да еще по принципу ББ... Жуть!
[00:14:35] <boris_ilov> когда повелся на ББ
[00:14:46] <boris_ilov> у Вирта то гораздо грамотнее написано
[00:14:52] <vаlexey> :-)
[00:14:55] <boris_ilov> И проще и эффективнее
[00:15:02] <vаlexey> boris_ilov: а зачем на Си?
[00:15:09] <vlad2> Забей на С, пиши на oberonjs! ;)
[00:15:10] <vаlexey> почему там не на луа, или 1С?
[00:15:11] <boris_ilov> помните тот массив ключевых слов?
[00:15:15] <vаlexey> Или жаба-шарп?
[00:15:28] <vаlexey> ы?
[00:15:33] <vlad2> Ага.
[00:15:43] <boris_ilov> ну я помню говорили типа че за бред
[00:15:54] <boris_ilov> а это ведь оптимизация
[00:15:56] <kpmý> бб же по мотивам OP2, разве его вирт не одобрил?
[00:16:02] <boris_ilov> и довольно не хилая
[00:16:40] <boris_ilov> не знаю чего там вирт одобрял
[00:16:50] <boris_ilov> но его лексер гораздо умнее написан
[00:16:57] <boris_ilov> в V5
[00:17:15] <kpmý> что за v5?
[00:17:27] <boris_ilov> Oberon V5
[00:17:30] <kpmý> а
[00:17:42] <vаlexey> а в оригинальном обероне?
[00:17:46] <vаlexey> изначальном
[00:17:49] <boris_ilov> ща гляну
[00:18:11] <vаlexey> стандарт на модулу-2 предлагают за £432.00 :-)
[00:18:42] <kpmý> какая точность
[00:19:00] <boris_ilov> неа в старом не так
[00:19:51] <boris_ilov> слушайте это только у меня гитхаб гонит? https://github.com/ilovb/ProjectOberonV4/blob/master/OBS.Mod
[00:20:03] <boris_ilov> одну строчку показывает
[00:20:29] <kpmý> да
[00:20:31] <тихий бот> kpmý, нет
[00:20:34] <kpmý> там рядом скроллер мелкий
[00:20:48] <boris_ilov> чет они сломали
[00:20:56] <vlad2> вебпрограммеры...
[00:21:03] <vаlexey> https://raw.githubusercontent.com/ilovb/ProjectOberonV4/master/OBS.Mod
[00:21:08] <vаlexey> лучше так смотреть :-)
[00:21:27] <kpmý> может там юниксовые переводы строки важны
[00:22:21] <boris_ilov> раньше нормально было
[00:24:43] <kpmý> когда будет новая оберон система в браузере?
[00:24:50] <vаlexey> а надо?
[00:25:06] <boris_ilov> давно есть уже
[00:25:09] <kpmý> странный вопрос
[00:25:16] <vаlexey> http://www.excelsior-usa.com/pdf/m2legacy2000.pdf
[00:25:17] <vаlexey> Ы!
[00:25:34] <boris_ilov> kpmy: http://schierlm.github.io/OberonEmulator/
[00:25:40] <s6> Спутники "Метеор-М" и "Рэлек" выведены на целевую орбиту
08.07.2014 - 23:46
На заданные орбиты вышли российский спутник дистанционного зондирования Земли "Метеор-М" номер 2 и малый космический аппарат "Рэлек", передает Роскосомос.
"В 20:57 спутник "Метеор-М" отделился от разгонного блока "Фрегат" и вышел на целевую орбиту, а в 21:39 от разгонного блока произошло отделение аппарата "Рэлек" оба спутника выведены на целевую орбиту", - подчеркнули в ведомстве.
Напомним, что теперь "Метеор-М" номер 2 станет вторым аппаратом космического комплекса гидрометеорологического и океанографического обеспечения "Метеор-3М". Первый спутник "Метеор-М" был успешно запущен 17 сентября 2009 года.
Космический аппарат "Рэлек" предназначен для изучения высотных электрических разрядов, атмосферных явлений и высыпаний электронов из радиационных поясов Земли, пишет "Российская газета".
[00:26:45] <kpmý> да, круто
[00:34:54] <s6> ыыыы
[00:35:18] <s6> это дажэ не оберонжс, это оберонсистемжс =))))
[00:36:20] <boris_ilov> мне через три дня спартан приедет
[00:36:41] <boris_ilov> буду жить и творить в настоящем обероне
[00:37:03] <boris_ilov> я тут кстати приобрел "Читаем Тьюринга"
[00:37:14] <boris_ilov> интересная книжка
[00:37:34] <s6> а я думал я провалился по тестам у аргентинцев. Ан нет - прислали письмо, обещают проект дать
[00:37:48] <boris_ilov> начинается повествование с диофантовой арифметики
[00:38:05] <boris_ilov> и дале до оснований современной CS
[00:38:23] <boris_ilov> лямбды тьюринг etc...
[00:38:41] <boris_ilov> только начал читать
[00:38:41] <s6> умный будешь =)
[00:38:49] <boris_ilov> интересно до усраки
[00:39:10] <boris_ilov> не умный, а начитанный ;)
[00:39:37] <s6> да умный, чо уж там. умные книжки упражняют ум и делают его отточеннее и шире
[00:39:45] <boris_ilov> Программируем на Lua тоже приобрел
[00:40:07] <boris_ilov> перевод в обоих книгах на первый взгляд довольно сносный
[00:40:24] <boris_ilov> "Программирование на Lua"9
[00:40:28] <boris_ilov> lf tg
[00:40:34] <boris_ilov> да что ты....
[00:40:41] <s6> луа вроде синтаксис красивенький
[00:40:55] <boris_ilov> красивый
[00:41:07] <s6> только я с четвертьпинка ничо не понял
[00:41:10] <kpmý> можно из книжек запомнить цитаты и потом убивать ими споры
[00:41:21] <boris_ilov> тык вот :D
[00:41:39] <boris_ilov> надож топливо для слюнобрызгалки
[00:42:25] <boris_ilov> теперь буду тьюринга из первоисточника цитировать :D
[00:42:30] <boris_ilov> чтоб наверняка
[00:43:39] <boris_ilov> переплет кстати в обеих книгах говно как обычно в ДМК
[00:44:31] <vаlexey> а мне вроде на след. неделе должно приехать
[00:44:41] <boris_ilov> фпга?
[00:45:17] <vаlexey> да
[00:45:19] <тихий бот> vаlexey, нет
[00:45:21] <boris_ilov> Тьюринга покупайте, товарищи. Советую. Я аналогов не видел.
[00:45:40] <kpmý> не купи книгу - спаси деревцо
[00:46:05] <boris_ilov> как говорит valexey, нужно инвестировать в свой скилл
[00:46:23] <boris_ilov> пока еще котелок варит
[00:46:37] <vаlexey> это точно
[00:48:01] <boris_ilov> покупать лучше на охоне
[00:48:06] <boris_ilov> озоне*
[00:48:15] <vаlexey> а ебука нету?
[00:48:23] <boris_ilov> неа
[00:48:33] <boris_ilov> пока по крайней мере
[00:49:35] <boris_ilov> на озоне дешевле всего
[00:49:49] <boris_ilov> если только в городе нет ДМК
[00:50:08] <boris_ilov> раз уж тут разсоветовался то вот еще
[00:50:42] <boris_ilov> книги по математике лучше покупать тут http://www.mccme.ru/
[00:51:01] <boris_ilov> дешевле не найти
[00:51:50] <boris_ilov> процесс покупки немного деревенский
[00:51:56] <vаlexey> /me прикупил себе скобочек. теперь они всегда со мной!
[00:52:06] <boris_ilov> чегой?
[00:52:37] <vаlexey> и всёй!
[00:53:07] <boris_ilov> что за скобочки?
[00:53:18] <boris_ilov> вот сцыль на магазин http://biblio.mccme.ru/shop/order
[00:53:50] <vаlexey> ну вот встретимся 14 сентября - покажу :-)
[00:54:18] <boris_ilov> звучит на 5-10 лет строгого режима :D
[00:55:04] <vаlexey> :-)
[01:11:25] <vаlexey> дас. скобочки прибавляют забот. однако без них всё будет не правильно, увы. либо бардак, либо скобочки!
[01:12:46] <kpmý> http://img0.joyreactor.cc/pics/comment/%D0%B3%D0%B8%D1%84%D0%BA%D0%B8-%D0%BF%D1%8C%D1%8F%D0%BD%D1%8B%D0%B9-%D1%81%D1%82%D0%BE%D0%BB%D0%B1%D0%B8%D0%BA-%D0%BD%D0%B0-%D1%84%D0%B5%D1%81%D1%82%D0%B8%D0%B2%D0%B0%D0%BB%D0%B5-%D0%BA%D0%BE%D1%81%D0%BF%D0%BB%D0%B5%D1%8F-237660.jpeg
[01:14:26] <vаlexey> поздняк - сбежал уже...
[01:23:29] <boris_ilov> у свердлова символ присваивания Ass называется :D
[01:24:08] <boris_ilov> http://memesmix.net/media/created/1fro94.jpg
[01:24:16] <boris_ilov> это все вирус функциональщины
[01:24:23] <boris_ilov> он чуйствует! :D
[01:25:41] <vаlexey> Ж-)
[01:33:47] <boris_ilov> блин чет не интересно как у Вирта писать
[01:34:15] <boris_ilov> джаст фо фан нужно написать еще эффективнее :D
[01:34:55] <boris_ilov> сканить будет со скоростью света
[01:36:32] <vаlexey> преждевременная оптимизация... если менять язык, то я бы скорее выбрал наиболее гибкую реализацию сканера, парсера и семантического анализатора, нежели самую быструю
[01:37:06] <boris_ilov> в таком случае нужно виртовскую брать как есть
[01:37:50] <s6> .ad;наркоман;http\://img0.joyreactor.cc/pics/comment/%D0%B3%D0%B8%D1%84%D0%BA%D0%B8-%D0%BF%D1%8C%D1%8F%D0%BD%D1%8B%D0%B9-%D1%81%D1%82%D0%BE%D0%BB%D0%B1%D0%B8%D0%BA-%D0%BD%D0%B0-%D1%84%D0%B5%D1%81%D1%82%D0%B8%D0%B2%D0%B0%D0%BB%D0%B5-%D0%BA%D0%BE%D1%81%D0%BF%D0%BB%D0%B5%D1%8F-237660.jpeg
[01:37:52] <тихий бот> s6, "наркоман" assigned
[01:37:55] <vаlexey> там не гибко :-) там на однопроходность заточено. что накладывает ограничения
[01:38:11] <boris_ilov> опять клеветы
[01:38:22] <boris_ilov> где ты там "не гибко" увидел
[01:38:25] <boris_ilov> ?
[01:38:25] <тихий бот> тварь я дрожащая, или тот, кому надо?
[01:39:01] <boris_ilov> там единственный минус - это привязка к ASCII
[01:39:09] <vаlexey> я уже описал где.
[01:39:18] <vаlexey> http://www.adme.ru/adoftheday/kupi-bele-poraduj-zhenu-717810/
[01:39:22] <vаlexey> :-D
[01:39:23] <тихий бот> вахахахаха
[01:40:26] <boris_ilov> vаlexey: можешь более конкретно сказать?
[01:41:05] <boris_ilov> http://risovach.ru/upload/2013/03/mem/nu-davay-taya-rasskazhi-kak-ty-men_13614172_big_.jpeg
[01:42:05] <boris_ilov> однопроходность к лексеру вообще отношения иметь не может
[01:43:08] <boris_ilov> хоть десять проходов. лексер один хер один раз отработает
[01:46:40] <boris_ilov> такс
[01:46:51] <boris_ilov> нужно лексер Lua покурить
[01:47:07] <boris_ilov> чет я не понимаю как с UTF8 обращаться
[01:47:31] <kpmý> like a boss
[01:50:01] <boris_ilov> жесть http://www.lua.org/source/5.2/llex.h.html
[01:50:20] <boris_ilov> ну и кто тут еще хочет лексер вирта плохим назвать? :D
[01:51:31] <kpmý> нечестно с виртом сравнивать, ведь на обероне такое говно не получится написать)
[01:53:59] <boris_ilov> пиздец я в шоке http://www.lua.org/source/5.2/llex.c.html
[01:54:10] <boris_ilov> goto етить колотить!
[01:57:01] <boris_ilov> мда
[01:57:09] <vаlexey> как будто это что-то плохое...
[01:57:20] <boris_ilov> после такой говени начинаешь вирта уважать в квадрате
[01:57:51] <kpmý> люди пишут рабочий код, а не дрочат на академичность
!
[01:58:08] <vаlexey> "Goto и его заменители позволяют упростить логику программы, сократить программу и облегчить понимание." (c) oberoncore
[01:58:09] <kpmý> бизнесу достаточно
[01:58:30] <boris_ilov> ты уверен что он рабочий?
[01:58:36] <kpmý> а че, луа не написана на самой себе?
[01:58:45] <boris_ilov> нет
[01:58:47] <тихий бот> Нет, не нет...
[01:58:52] <vаlexey> был бы компилятор - была бы написана
[01:58:55] <vаlexey> а так смысла нуль
[01:59:32] <boris_ilov> valexey: Кто это такую ересь на коре высказал?
[01:59:50] <vаlexey> http://forum.oberoncore.ru/viewtopic.php?f=62&t=5168&hilit=goto#p88210
[02:00:42] <boris_ilov> Аааа
[02:00:48] <boris_ilov> Тышов то да
[02:00:59] <boris_ilov> главный эксперт
[02:04:38] <vаlexey> Драконофилы :-)
[02:05:26] <vаlexey> Таргариены :-)
[02:05:39] <boris_ilov> вот по лексеру Луа хорошо видно на сколько проще Оберон
[02:06:14] <vаlexey> лексемы у Луа да.
[02:06:25] <vаlexey> но ты не путай ЯП с его терминалами :-)
[02:08:19] <boris_ilov> а ведь приемуществ ноль
[02:08:45] <vаlexey> у луа то? угу. говно язык :-)
[02:08:53] <boris_ilov> прям наглядное пособие как раздуть и усложнить систему на ровном месте и не получить ничего в замен
[02:10:47] <boris_ilov> А ведь у Вирта не детский лексер
[02:11:00] <boris_ilov> а самый настоящий взрослый и полноценный
[02:11:24] <boris_ilov> но при этом он на порядок проще
[02:12:06] <boris_ilov> И при этом язык более серьезный
[02:12:09] <boris_ilov> Парадокс
[02:12:37] <boris_ilov> надо из оберона сделать убийцу Lua
[02:12:58] <vаlexey> да, бывает :-)
[02:13:09] <vаlexey> но попробуй, да. интересно
[02:13:21] <boris_ilov> по сути только функции с замыканиями с боку прикрутить
[02:13:30] <boris_ilov> и форыч
[02:18:52] <s6> наркоман
[02:18:52] <тихий бот> http://img0.joyreactor.cc/pics/comment/%D0%B3%D0%B8%D1%84%D0%BA%D0%B8-%D0%BF%D1%8C%D1%8F%D0%BD%D1%8B%D0%B9-%D1%81%D1%82%D0%BE%D0%BB%D0%B1%D0%B8%D0%BA-%D0%BD%D0%B0-%D1%84%D0%B5%D1%81%D1%82%D0%B8%D0%B2%D0%B0%D0%BB%D0%B5-%D0%BA%D0%BE%D1%81%D0%BF%D0%BB%D0%B5%D1%8F-237660.jpeg
[02:28:47] <boris_ilov> блин писец
[02:28:52] <boris_ilov> default: {
if (lislalpha(ls->current)) { /* identifier or reserved word? */
[02:29:05] <boris_ilov> я сначала так же написал
[02:29:34] <boris_ilov> но я сразу понял что это глупое решение
[02:30:20] <boris_ilov> как же так то?
[02:31:23] <boris_ilov> в начале нужно проверять
[02:31:27] <boris_ilov> в начале!
[02:31:35] <boris_ilov> это же очевидно
[02:31:57] <boris_ilov> в общем ну нахер этих пейсателей
[02:32:10] <boris_ilov> я по вирту буду писать
[02:33:04] <boris_ilov> вот только с UTF8 нужно разобраться
[02:33:24] <boris_ilov> как там определять что буква, а что нет
[08:08:15] <Kemet> --
[08:52:56] <geniepro> https://pbs.twimg.com/media/BsCw2mnIMAEaLHB.jpg
[12:12:51] <kpmý> [02:33:04] <boris_ilov> вот только с UTF8 нужно разобраться
[02:33:24] <boris_ilov> как там определять что буква, а что нет
https://bitbucket.org/oberoncore/strings/src/0b91af9ed95a3a4490979327e1e1315218bc0bde/Strings/Mod/Utf.odc?at=default
[13:07:59] <geniepro> http://www.kp.ru/daily/romania-2014/
[13:45:43] <geniepro> валексей, как приедешь из гейропы, расскажи -- написанное в http://petrovchik.livejournal.com/219901.html -- правда? ))
[14:38:15] <vаlexey> geniepro: да это и в США примерно так :-) На Украину там всем глубоко пофиг. Украина, Россия, Белоруссия - это всё одна страна и одна территория с точки зрения их.
[14:44:07] <vаlexey> https://scontent-b-fra.xx.fbcdn.net/hphotos-xpf1/t1.0-9/983741_10154323372995655_6010606591173864938_n.jpg
[15:30:58] <vаlexey> http://lenta.ru/photo/2014/07/08/kapitsa
[16:10:09] <geniepro> http://rssmp.moy.su/_ph/4/333464632.jpg
[16:23:38] <geniepro> http://www.odnako.org/blogs/o-pohishcheniyah-rossiyskih-grazhdan/
валексей, ты там в гейропах и штатах поаккуратнее гуляй -- пахитят вдруг )))
[16:32:50] <geniepro> http://s00.yaplakal.com/pics/pics_original/4/5/3/2331354.jpg
[16:43:09] <geniepro> http://novorus.info/news/policy/24858-bomba-dlya-ukrainy-ot-obse-krym-otoshel-k-rossii-v-poryadke-restitucii.html
[16:43:25] <geniepro> так чо, с Крымом всё окей значит -- ретситуция произошла )))
[16:43:32] <geniepro> реституция*
[16:54:22] <geniepro> *
[16:54:23] <тихий бот> geniepro, ② - ④
[17:04:56] <vаlexey> да кому я нужен? ;-)
[17:46:04] <s6>
31<орёл>30 Бомба для Украины от ОБСЕ: Крым отошел к России в порядке реституции.
31<орёл>30 http://www.pravda-tv.ru/2014/07/08/68978
[19:09:28] <vlad2> vаlexey: не соглашусь - у америкосов как раз нет понимания, что это все один народ. Потому втюхать им агрессию россии и борьбу за независимость очень легко.
[19:10:06] <alexey.veselovsky> втюхать - да, но по умолчанию, это все русские. :-)
[19:10:12] <alexey.veselovsky> ну или поляки - один фиг ;-)
[19:34:50] <kpmý> yotaбляди не придумали ничего лучше, как активировать девайс исключительно с помощью internet explorer
[19:35:08] <alexey.veselovsky> гыгы
[19:35:47] <vlad2> Трололо!
[19:35:56] <kpmý> да, лохи с хромом пусть страдают и просят помощи у тех.саппорта
[19:36:08] <vlad2> IE - это программа для скачивания хрома!
[19:36:21] <kpmý> а теперь еще и для активации Ёты
[19:37:03] <vlad2> (а еще сафари - вчера два раза скачивал хром)
[19:37:40] <kpmý> зато теперь есть бесплатные 64 килобита в секунду беспроводного интернета
[19:38:27] <kpmý> halyava
[19:38:43] <vlad2> kpmý: как там правильно (по info21) назвается шина по-английски? А то я вчера так и не нагуглил.
[19:39:04] <vlad2> Обозвал "generic message bus".
[19:39:22] <alexey.veselovsky> bus - это шина
[19:39:38] <kpmý> generic message bus
[19:39:42] <alexey.veselovsky> usb - это как раз универсальная последовательная шина
[19:40:03] <alexey.veselovsky> universal serial bus
[19:40:57] <vlad2> Вобщем вчера коммитнул - теперь еберон поддерживают эту саму шину в виде IF/ELSIF
[19:42:42] <alexey.veselovsky> э? типа вместо кейса получился иф? :-)
[19:43:26] <vlad2> Ну в смысле - расширил сужение типа для VAR-аргументов.
[19:44:15] <vlad2> Следующий коммит будет запрет изменения аргументов + сужение типов для аргументов (т.е. для POINTER).
[19:45:28] <vlad2> https://github.com/vladfolts/oberonjs/blob/master/test/input/eberon/generic_message_bus.ob
[19:47:07] <alexey.veselovsky> вирт бы не одобрил это фичевание языка!!1
[19:47:10] <alexey.veselovsky> ;-)
[19:47:51] <vlad2> Да ладно - даже синтаксис не поменялся ;)
[19:48:06] <vlad2> Впрочем ilovb я уже слышал :)
[19:48:09] <alexey.veselovsky> именно! а семантика поменялась! это ж ужас! это неявность!
[19:48:27] <alexey.veselovsky> а что он говорил?
[19:48:48] <vlad2> Что он в шоке от такого издевательства над детищем Врта :)
[19:49:07] <alexey.veselovsky> :-)
[19:49:22] <vlad2> А. Еще кемет хорошо сказал :)
[19:49:30] <vlad2> Но не помню дословно.
[19:50:12] <vlad2> Зорко, кстати, спокойно отреагировал - но он просто уже поставил на мне крест как на оберонщике :)
[19:50:29] <alexey.veselovsky> зорко сам фичует оберон по самое немогу
[19:51:11] <vlad2> Ну у него там фичи такие, вполне консервативные.
[19:53:48] <alexey.veselovsky> ну, как сказать... один вид структурных литералов например
[19:54:30] <vlad2> Это где?
[19:58:34] <kpmý> https://pbs.twimg.com/media/BsHCHx1CAAA2XPs.jpg:large
[20:01:47] <vlad2> О, а вот и ilovb!
[20:02:48] <boris_ilov> kpmy: спасибо, но не то
[20:03:06] <boris_ilov> мне нужен аналог isalpha для utf-8
[20:03:50] <boris_ilov> или там коды больше 255 все alpha?
[20:03:51] <vlad2> Тебе чтоб не только с латиницей?
[20:03:58] <boris_ilov> угу
[20:04:19] <boris_ilov> не то чтобы нужно прямо сейчас
[20:04:33] <vlad2> ХЗ. См. юникодную доку какие там диапазоны для чего.
[20:04:35] <boris_ilov> но заложиться на utf-8 и utf-16 думаю стоит
[20:05:36] <boris_ilov> т.е. UTF-8 для хранения
[20:05:46] <boris_ilov> и UTF-16 для манипуляций
[20:06:06] <boris_ilov> для всего остального ARRAY OF что_удобно
[20:06:33] <boris_ilov> В общем для UTF-8 мне нужен только годный декодер
[20:06:40] <vlad2> Все равно не очень понимаю, чего ты паришься - считай isalpha все, что не проблею
[20:06:41] <boris_ilov> и isalpha
[20:06:54] <boris_ilov> вот я тоже так думаю
[20:07:10] <boris_ilov> просто хочу убедиться что это правильно
[20:07:21] <vlad2> Тогда рой доки :)
[20:07:54] <boris_ilov> о!
[20:08:02] <boris_ilov> надо исходники Go покурить
[20:08:06] <boris_ilov> там должно быть
[20:08:25] <vlad2> В стьогу сена ;)
[20:08:49] <boris_ilov> это ж не ББ
[20:08:51] <boris_ilov> :D
[20:09:01] <boris_ilov> там годок годный
[20:09:07] <boris_ilov> http://golang.org/pkg/unicode/utf8/
[20:14:06] <boris_ilov> ух ёпп http://golang.org/src/pkg/unicode/letter_test.go
[20:14:37] <boris_ilov> я так понимаю мне нужны эти маски
[20:14:43] <boris_ilov> var letterTest = []rune{
54 0x41,
55 0x61,
56 0xaa,
57 0xba,
58 0xc8,
59 0xdb,
60 0xf9,
61 0x2ec,
62 0x535,
63 0x620,
64 0x6e6,
65 0x93d,
66 0xa15,
67 0xb99,
68 0xdc0,
69 0xedd,
70 0x1000,
71 0x1200,
72 0x1312,
73 0x1401,
74 0x1885,
75 0x2c00,
76 0xa800,
77 0xf900,
78 0xfa30,
79 0xffda,
80 0xffdc,
81 0x10000,
82 0x10300,
83 0x10400,
84 0x20000,
85 0x2f800,
86 0x2fa1d,
87 }
[20:21:02] <boris_ilov> вот оно http://en.wikipedia.org/wiki/UTF-8#Codepage_layout
[20:22:37] <kpmý> вот в подсистеме Unicode у цинна есть модуль NormLetter, там есть что-то про IsLetter
[20:23:05] <kpmý> не хуже чем в Го
[20:23:25] <kpmý> а, надо смотреть UnicodeLetter_Mapping
[20:27:56] <geniepro> http://ic.pics.livejournal.com/kara881/52850199/66273/66273_1000.jpg
[20:28:35] <geniepro> "В Краматорске на городском форуме местная пятая колонна сдает людей связанных с ополчением и особенно показателен момент, когда брат сдает фашистам свою сестру.
http://www.kramatorsk.info/talk/index.php?topic=38329.0
"
[20:28:57] <kpmý> веселовский же не в краматорске живет вроде :)
[20:30:35] <boris_ilov> забавная у цинна IsLetter
[20:30:51] <geniepro> там своих веселовских хватает )))
[20:31:25] <kpmý> осведомиты
[20:32:09] <boris_ilov> ох цинн молдчина
[20:32:18] <boris_ilov> сцылочку в комментах оставил http://www.unicode.org/Public/6.3.0/ucd/UnicodeData.txt
[20:32:48] <kpmý> а вроде там другой автор этой подсистемы
[20:33:28] <boris_ilov> ну значит он молодец
[20:33:45] <boris_ilov> сей неизвестный добродетель
[20:33:59] <boris_ilov> Werner Bossert
[20:34:31] <kpmý> модули там суровые
[20:35:02] <kpmý> Windows_936_Mapping.ocf 850,3 Кб 07.10.13 23:41 -a--
GBKUni_Mapping.ocf 724,7 Кб 07.10.13 23:41 -a--
Windows_950_Mapping.ocf 711,4 Кб 07.10.13 23:41 -a--
Big5_Mapping.ocf 710,1 Кб 07.10.13 23:41 -a--
Windows_949_Mapping.ocf 663,3 Кб 07.10.13 23:41 -a--
Windows_932_Mapping.ocf 481,1 Кб 07.10.13 23:41 -a--
EUC_KR_Mapping.ocf 442,8 Кб 07.10.13 23:41 -a--
GB2312_Mapping.ocf 434,5 Кб 07.10.13 23:41 -a--
EUC_CN_Mapping.ocf 432,9 Кб 07.10.13 23:41 -a--
Johab_Mapping.ocf 431,4 Кб 07.10.13 23:41 -a--
Shift_JIS_Mapping.ocf 372,9 Кб 07.10.13 23:41 -a--
EUC_JP_Mapping.ocf 369,7 Кб 07.10.13 23:41 -a--
JIS_X_0212_Mapping.ocf 316,3 Кб 07.10.13 23:41 -a--
[20:35:06] <kpmý> чистый код
[20:35:18] <boris_ilov> на самом деле там не код а данные
[20:35:26] <boris_ilov> что мне не очень понятно
[20:35:36] <boris_ilov> я бы данные в отдельных файлах оставил
[20:35:47] <boris_ilov> и просто грузил при инициализации
[20:36:08] <boris_ilov> нах их в исходник пихать в таких объемах...
[20:36:56] <kpmý> ну, ocf же
[20:37:12] <kpmý> сравнение с константой вшито в тело процедуры
[20:37:20] <kpmý> как еще более эффективно сделать
[20:37:47] <boris_ilov> ну например не использовать деление и умножение
[20:38:45] <boris_ilov> http://bjoern.hoehrmann.de/utf-8/decoder/dfa/
[20:41:22] <boris_ilov> ну и как бы эффективность сего поделия никто не проверял вроде
[20:42:24] <boris_ilov> лично у мне кажется, что это должно быть дико медленная штука
[20:42:36] <boris_ilov> на первый взгляд по крайней мере
[20:43:13] <boris_ilov> как там ББ CASE компилит?
[20:43:20] <boris_ilov> не знаешь?
[20:43:59] <kpmý> неа
[20:44:04] <boris_ilov> ибо без оптимизации тут туевахуча лишних сравнений у него
[20:44:24] <kpmý> да какая разница, ты же все равно на С пишешь сейчас, на ББ понятнее прост принцип
[20:44:51] <boris_ilov> ну да
[20:45:10] <boris_ilov> один минус
[20:45:17] <boris_ilov> тут не UTF-8
[20:45:19] <boris_ilov> а 16
[20:45:32] <boris_ilov> хотя....
[20:45:39] <boris_ilov> какая нахер разница
[20:45:44] <alexey.veselovsky> а в бб UTF-16? вроде всегда был ucs-2
[20:45:46] <boris_ilov> все равно же декодирую
[20:45:55] <boris_ilov> а это не одно и то же?
[20:46:02] <alexey.veselovsky> нет конечно
[20:46:03] <kpmý> ucs2 это миф на самом деле
[20:46:14] <boris_ilov> вот я тоже так считал
[20:46:15] <alexey.veselovsky> у utf-16 переменная длина символа, а у ucs-2 фиксированная
[20:46:15] <kpmý> тогда, когда делали ББ в винде был ucs2
[20:46:35] <kpmý> а теперь в винде просто двухбайтный юникод и еще 2 байта дополнения
[20:46:46] <kpmý> то есть в ББ просто виндовая система символов
[20:47:01] <alexey.veselovsky> жуть
[20:47:04] <kpmý> а они ее в мелкософте уже не называют ucs2)
[20:47:11] <alexey.veselovsky> то есть позиционироваться за O(1) таки нельзя?
[20:47:27] <alexey.veselovsky> в винде (по крайней мере в шарпе) вроде как UTF-16
[20:47:34] <alexey.veselovsky> со всеми радостями
[20:47:38] <alexey.veselovsky> как и в жабе
[20:48:40] <kpmý> ну, технически бояться нечего, ведь всякий треш из дополнений ББ не поддерживает
[20:50:05] <boris_ilov> да в общем то не велика разница
[20:50:12] <boris_ilov> A: UCS-2 is obsolete terminology which refers to a Unicode implementation up to Unicode 1.1, before surrogate code points and UTF-16 were added to Version 2.0 of the standard. This term should now be avoided.
UCS-2 does not describe a data format distinct from UTF-16, because both use exactly the same 16-bit code unit representations. However, UCS-2 does not interpret surrogate code points, and thus cannot be used to conformantly represent supplementary characters.
Sometimes in the past an implementation has been labeled "UCS-2" to indicate that it does not support supplementary characters and doesn't interpret pairs of surrogate code points as characters. Such an implementation would not handle processing of character properties, code point boundaries, collation, etc. for supplementary characters
[20:50:48] <boris_ilov> UCS-2 это UTF16 без неких доп символов грубо говоря
[20:52:47] <geniepro> boris_ilov: доп символы там есть, но он их игнорирует
[20:53:23] <alexey.veselovsky> UTF-16 это полноценный юникод. ucs-2 -- нет
[20:53:26] <alexey.veselovsky> вот и все :-)
[20:53:35] <boris_ilov> не
[20:53:46] <boris_ilov> UCS-2 это устаревший юникод
[20:53:57] <alexey.veselovsky> поэтому он нынче не является полноценным
[20:54:11] <boris_ilov> кста
[20:54:20] <kpmý> неделю назад вышла новая ревизия юникода, так что нынче никто не полноценен
[20:54:20] <boris_ilov> а нахер UTF-32?
[20:54:28] <alexey.veselovsky> это == ucs-4 :-)
[20:54:38] <kpmý> чтобы не парить мозги дополнениями
[20:54:39] <alexey.veselovsky> позиционирование за O(1) всегда
[20:55:14] <boris_ilov> а в UTF-16 нельзя?
[20:55:39] <alexey.veselovsky> нельзя
[20:55:40] <тихий бот> нельзя так просто взять и сказать "Нельзя"!
[20:55:52] <kpmý> зя
[20:56:08] <alexey.veselovsky> там же переменная длина символа
[20:56:36] <boris_ilov> ну и что?
[20:56:41] <boris_ilov> байта то 2
[20:56:45] <boris_ilov> всегда
[20:56:49] <alexey.veselovsky> нет
[20:56:49] <тихий бот> Нет, не нет...
[20:57:14] <kpmý> не все символы помещаются в них, поэтому возможны еще два байта
[20:57:21] <kpmý> как utf8
[20:57:27] <alexey.veselovsky> угу
[20:57:35] <kpmý> только секции по два байта вместо одного
[20:57:42] <alexey.veselovsky> ыгы
[20:57:54] <alexey.veselovsky> хорошо для тех CPU где байт равен 16 битам :-)
[20:57:55] <boris_ilov> а да
[20:57:57] <boris_ilov> прочитал
[20:58:12] <boris_ilov> хм...
[20:58:16] <alexey.veselovsky> UTF-16 это болезнь роста. уродец :-)
[20:58:25] <boris_ilov> может нах тогда UTF-16
[20:58:26] <alexey.veselovsky> костыль
[20:58:48] <alexey.veselovsky> поэтому я его и не люблю :-)
[20:58:55] <boris_ilov> на современных компах UTF-32 памяти особо не убавит
[20:59:09] <boris_ilov> а на контроллерах ASCII
[20:59:12] <kpmý> когда встретим инопланетян то utf32 будет уродцем
[20:59:20] <alexey.veselovsky> в два раза убавит :-) или даже в четыре. в зависимости от данных и задачи
[21:00:08] <boris_ilov> для таких задач ASCII
[21:00:27] <boris_ilov> т.е. думаю нужно поддерживать только ASCII и UTF-32
[21:00:28] <alexey.veselovsky> utf-8 :-) оно как раз подходит :-)
[21:00:51] <boris_ilov> ну UTF-8 в обработке совсем жопа
[21:01:18] <alexey.veselovsky> принципиально - там нет никакой особой разницы с utf-16
[21:01:19] <boris_ilov> только для хранения подходит
[21:01:37] <alexey.veselovsky> хранения, склеивания строк и так далее
[21:01:52] <alexey.veselovsky> для парсинга тоже подходит вполне.
[21:02:10] <alexey.veselovsky> не много задач трубуют доступа к символу по номеру
[21:02:18] <alexey.veselovsky> random access по номеру
[21:02:30] <geniepro> в принципе, в utf-8возможны комбинации из 6 байт, а теоретически вообще неограниченно
так что ucs-4 тоже неполноценен -- его может не хватить на некоторых возможных алфавитах
[21:02:56] <alexey.veselovsky> только на практике таких алфавитов не будет
[21:03:07] <alexey.veselovsky> ибо экспонента :-)
[21:05:12] <boris_ilov> чет вы меня совсем расстроили
[21:05:16] <boris_ilov> че делать то?
[21:05:37] <kpmý> ну все просто же - хранить в utf8, в памяти держать в utf32
[21:06:29] <boris_ilov> я что-то подумал что 90% времени UTF32 на каждый байт три пустых будет держать
[21:06:50] <boris_ilov> вечная диллема между памятью и скоростью
[21:07:07] <boris_ilov> дилемма*
[21:07:11] <boris_ilov> :D
[21:07:18] <kpmý> быстрый буфер в твоем промежуточном состоянии utf32 много памяти не съест
[21:07:38] <boris_ilov> в компилере то да
[21:07:51] <boris_ilov> я имею в виду в языке что пользовать
[21:08:58] <boris_ilov> вот надо будет тебе большой ангельский текст обработать
[21:09:13] <boris_ilov> а он в памяти будет в 4 раза больше места занимать чем надо
[21:09:19] <alexey.veselovsky> это должен вообще говоря, выбирать программист, а не аффтар языка
[21:09:29] <kpmý> да, я бы его не стал в память класть
[21:09:33] <alexey.veselovsky> это должно быть в либах либо в рантайме. поддержка ВСЕГО
[21:09:37] <boris_ilov> ну размер чара то нужно закрепить
[21:09:48] <alexey.veselovsky> не нужен чар
[21:09:56] <boris_ilov> выкинуть нахер?
[21:09:56] <alexey.veselovsky> нужен байт и все
[21:10:11] <alexey.veselovsky> а чар - если это именно символ, это абстракция
[21:10:26] <alexey.veselovsky> за которой может скрываться вообще слайс из байтового потока
[21:10:34] <kpmý> да, вот список чаров нужен, а чар не нужен)
[21:10:46] <boris_ilov> тык тогда и поддержку строк придется выкинуть
[21:11:04] <boris_ilov> т.е. А := "dfdsfdsf" уже не сделаешь
[21:11:14] <alexey.veselovsky> ну можно и встроить. но это должно быть что-то бОльшее чем стринг в джаве скажем
[21:11:37] <alexey.veselovsky> почему? сделаешь! единственное что ты должен определить в языке - это формат исходников. кодировку их
[21:11:50] <boris_ilov> я думал об этом
[21:11:52] <alexey.veselovsky> и тогда уже компилятор сам все расставит - он же знает кодировку строкового литерала.
[21:12:05] <boris_ilov> гемор получается
[21:12:11] <alexey.veselovsky> угу
[21:12:27] <boris_ilov> s := "Ж" что это? массив или байт?
[21:12:40] <alexey.veselovsky> нет легкого пути :-) ну разве что от текста вообще отказаться, и сказать у что у нас тут - фортран, и идите нафиг :-)
[21:12:52] <alexey.veselovsky> зависит от того, что у тебя за язык :-)
[21:12:57] <alexey.veselovsky> как определишь, так и будет
[21:13:09] <kpmý> в TextModels там отдельный тип Piece на каждый размер символа
[21:13:12] <alexey.veselovsky> в Обероне это определяется ТИПОМ левой части statement’a
[21:13:32] <alexey.veselovsky> что довольно криво, ибо выходит что у “Ж” нет типа как такового
[21:13:44] <alexey.veselovsky> у Вирта вообще с литералами беда, и с типом констант тоже :-)
[21:13:46] <kpmý> то есть "abc" это однобайтный пис, а "abcбля" это уже двубайтный
[21:14:22] <kpmý> у вирта все норм же
[21:14:35] <boris_ilov> тык у него ASCII
[21:14:41] <boris_ilov> :D
[21:14:54] <kpmý> нормальным людям даже переключатель раскладки не нужен
[21:15:37] <boris_ilov> пендосам?
[21:16:27] <boris_ilov> переменные на родном хер бы с ними
[21:16:32] <boris_ilov> меня s := "Ж" беспокоит
[21:17:32] <boris_ilov> хотя наверно таки нужно UTF32
[21:17:46] <alexey.veselovsky> у вирта не ASCII :-)
[21:17:52] <boris_ilov> просто не пользоваться встроенными строками для жестоких задач и все
[21:18:00] <alexey.veselovsky> он сам не определился, но иногда у него проскакивало что у него таки latin-1
[21:18:16] <boris_ilov> да точно
[21:19:38] <kpmý> вообще эта херня довольно унылая
[21:19:48] <boris_ilov> какая?
[21:19:56] <kpmý> в 2014-м все еще парятся про размер int на конкретной системе
[21:20:15] <kpmý> соответственно и размер символа точно будет зависеть от этого int
[21:20:15] <boris_ilov> ну вообще да
[21:21:22] <boris_ilov> надо реально CHAR к INTEGER приравнять и не париться
[21:21:25] <kpmý> короче, тебе нужен массив который будет содержать элементы разного размера
[21:21:44] <boris_ilov> ARRAY OF BYTE? ;)
[21:21:46] <kpmý> точнее, уже не массив
[21:22:50] <kpmý> ну вот строка "abcЯ" по идее уместится в пять байт оптимальной кодировки
[21:23:09] <kpmý> но при этом для строкового типа надо знать, что символов на самом деле четыре
[21:23:18] <kpmý> и последний занимает два байта
[21:23:42] <boris_ilov> по такому пути автор Lua пошел
[21:24:05] <kpmý> короче, надо переходить на троичную систему промежуточного представления
[21:24:20] <boris_ilov> В луа 5.3 будет utf-8
[21:24:21] <alexey.veselovsky> сделай инт переменной длины и всего делов :-)
[21:24:30] <alexey.veselovsky> как в хаскелле ;-)
[21:24:51] <boris_ilov> давайте рассуждать логически
[21:24:53] <kpmý> ленивый инт
[21:25:19] <boris_ilov> разве CHAR=INTEGER является проблемой?
[21:25:54] <boris_ilov> для обычных задач ведь не критично
[21:26:06] <kpmý> да, ведь размер INTEGER в байтах не задан жестко для всех платформ
[21:26:15] <boris_ilov> тык и пусть
[21:26:29] <kpmý> ну получается протекание железа на уровень языка)
[21:26:38] <boris_ilov> на 64 символ будет 8 байт занимать
[21:26:51] <boris_ilov> в 4 младших UTF32
[21:27:02] <kpmý> типа "ебать как в мире много железок, не будем устанавливать размер целого строго"
[21:27:27] <boris_ilov> а нах?
[21:27:41] <boris_ilov> меньше 32 байт только контроллеры
[21:27:47] <boris_ilov> могут быть
[21:27:52] <boris_ilov> тьху
[21:27:56] <boris_ilov> 32 бит
[21:28:29] <boris_ilov> там байты пусть юзают
[21:28:56] <boris_ilov> а на остальном UTF-32 который засунут в INTEGER которого всегда достаточно
[21:29:11] <geniepro> kpmý> типа "ебать как в мире много железок, не будем устанавливать размер целого строго"
правильно!
Нужно определить таки етипы как Int8, Int16, Int32, Int64, Int128 и безразмерный тип Integer
[21:29:35] <kpmý> дискриминация Int256!
[21:29:48] <geniepro> ну Int256 не скоро понадобится
[21:30:05] <kpmý> на какой-нибудь zfs он нужен уже сейчас!
[21:30:09] <boris_ilov> int256 это какая-то космическая цифра
[21:30:18] <geniepro> о_О она же 128-битная вроде
[21:30:58] <geniepro> boris_ilov> int256 это какая-то космическая цифра
количество элементарных частиц во вселенной легко умещается в 128 бит
[21:31:02] <geniepro> вроде
[21:31:09] <boris_ilov> тык вот
[21:31:16] <geniepro> ну может я нагнал -- но существенно меньше, чем 256 бит
[21:32:19] <alexey.veselovsky> надо просто как в Аде сделать и все :-)
[21:32:40] <alexey.veselovsky> дать возможность делать типы программисту. любого диапазона.
[21:32:56] <alexey.veselovsky> а как именно оно будет реализовано на конкретной железяке - дело компилятора и мануала к нему
[21:33:24] <boris_ilov> ну я это и предложил примерно
[21:33:34] <boris_ilov> UTF-32
[21:33:35] <kpmý> и получить в двух модулях разные инты)
[21:33:44] <alexey.veselovsky> ну и что?
[21:33:47] <boris_ilov> а как он хранится пусть компилер беспокооится
[21:33:50] <alexey.veselovsky> они же будут не совместимыми :-)
[21:33:56] <boris_ilov> кто?
[21:34:06] <alexey.veselovsky> эти разные инты в двух разных модулях
[21:34:10] <alexey.veselovsky> строгая же типизация
[21:34:24] <kpmý> но они же останутся интами
[21:34:34] <vlad2> Как полюбить JS за 7 дней. Никто не видел кинжку? Я бкупил.
[21:34:36] <alexey.veselovsky> приведение типа придется писать в выражениях явным образом. с range check в процессе
[21:34:36] <vlad2> js
[21:34:37] <geniepro> блин, если во вселенной действительно 10^81 элементарных частиц, то это 269 бит надо (((
[21:34:37] <тихий бот> отстой
[21:35:07] <alexey.veselovsky> то что внизу там скажем 32 бита слово лежит, в железе, никого не волнует :-)
[21:35:13] <boris_ilov> vlad2: Воткнуть карандаш в ухо поглубже и никаких книг не надо
[21:35:31] <geniepro> alexey.veselovsky> надо просто как в Аде сделать и все :-)
так вроде даже в аде есть предопределённые варианты целых чисел?
[21:35:51] <kpmý> местный бог создал мир за шесть дней, а ты не можешь полюбить js за 7
[21:36:13] <boris_ilov> "местный бог" ахаха
[21:36:40] <kpmý> geniepro: троичная система пооптимальнее будет
[21:36:58] <alexey.veselovsky> geniepro: не, там это все в стандартной либе тупо
[21:37:17] <geniepro> kpmý> geniepro: троичная система пооптимальнее будет
да, тройка ближе к е чем двойка
[21:37:22] <alexey.veselovsky> где прописано что вот от назовем -127 до 128 int8
[21:37:37] <alexey.veselovsky> кто хочет - пользуется, кто не хочет - кладет болт
[21:37:44] <geniepro> alexey.veselovsky> geniepro: не, там это все в стандартной либе тупо
ну вот именно! и незачем засорять язык ))) но должен быть стандарт!
[21:38:03] <alexey.veselovsky> да хоть не стандарт, но описание языка вменяемое :-)
[21:42:28] <boris_ilov> valexey: таки ASCII
[21:42:35] <boris_ilov> 128 символов
[21:44:01] <kpmý> аски 256 :)
[21:44:14] <kpmý> латин1 128
[21:44:15] <kpmý> вроде
[21:44:23] <boris_ilov> неа
[21:44:29] <geniepro> вообще вопрос о количестве элементарных частиц во вселенной некоректен! они же постоянно ращепляются и наоборот -- слипаются в другие частицы
правильнее говорить о количесвте энергии во вселенной или что то же самое -- о её массе
[21:44:29] <boris_ilov> и то и то 128
[21:47:31] <boris_ilov> как минимум тут на последней странице http://www.inf.ethz.ch/personal/wirth/CompilerConstruction/CompilerConstruction2.pdf
[21:48:03] <kpmý> .set;ascii;+[.+]
[21:48:03] <тихий бот> kpmý, "ascii" assigned
[21:48:08] <kpmý> .bf;ascii
[21:48:08] <тихий бот> kpmý, ascii started
[21:48:13] <тихий бот> 01H 02H 03H 04H 05H 06H 07H 08H
0BH 0CH
0EH 0FH 10H 11H 12H 13H 14H 15H 16H 17H 18H 19H 1AH 1BH 1CH 1DH 1EH 1FH !"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~
¡¢£¤¥¦§¨©ª«¬®¯°±²³´µ¶·¸¹º»¼½¾¿ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿ
[21:48:15] <kpmý> ща он вам всем покажет
[21:48:34] <alexey.veselovsky> в кодеровке же не только число бит играет роль, но и расположение символов в таблице
[21:48:56] <boris_ilov> ну в построении компиляторов ASCII
[21:49:01] <alexey.veselovsky> вирт вопросы кодировки старательно обходит
[21:49:04] <boris_ilov> думаю и в обероне тоже
[21:49:13] <alexey.veselovsky> в репорте у него менялось
[21:49:23] <alexey.veselovsky> то было упоминание о кодировке, то не было
[21:49:45] <alexey.veselovsky> у меня другой, практический вопрос - как русифицировать Оберон ОС? :-)
[21:49:55] <boris_ilov> из PO2013
[21:49:57] <boris_ilov> Remember that
individual characters are usually encoded in one byte each (ASCII-code).
[21:50:10] <kpmý> ну кодировка же линейная, в ней нет про биты, биты появляются в переложении позиции символа на восьмибитные машины
[21:51:08] <alexey.veselovsky> “CHAR the characters of a standard character set”
[21:51:12] <alexey.veselovsky> http://www.inf.ethz.ch/personal/wirth/Oberon/Oberon07.Report.pdf
[21:51:18] <alexey.veselovsky> вот и гадайте :-)
[21:51:25] <boris_ilov> гы гы
[21:51:27] <alexey.veselovsky> что такое стандартный чарсет
[21:51:33] <alexey.veselovsky> utf-32? ;-)
[21:51:43] <boris_ilov> поведение IF как обычно
[21:51:48] <boris_ilov> WHILE по стандарту
[21:51:51] <boris_ilov> :D
[21:51:54] <alexey.veselovsky> :-)
[21:52:07] <boris_ilov> прикольно так языки описывать
[21:52:45] <alexey.veselovsky> ага. компиляция языка из “общепринятых норм”
[21:52:48] <alexey.veselovsky> то есть описания языка
[21:52:57] <boris_ilov> а что делает CASE предлагаем читателю разобраться самостоятельно
[21:52:58] <kpmý> а вот микрософт с интелом встроят в процессоры ПЛИС и введут хардварный формат чара, для своих поисковиков
[21:53:19] <alexey.veselovsky> да плисы в персоналках и серверах - это баян давешний
[21:53:27] <alexey.veselovsky> широко используется для некоторых задач :-)
[21:53:30] <boris_ilov> да давно бы уже аппаратный декодер UTF-8 сделали :)
[21:53:37] <kpmý> но ведь интересно, какой формат они выберут
[21:53:40] <alexey.veselovsky> думаю он давно есть
[21:53:56] <kpmý> utf8 не подходит для потоковой обработки же
[21:54:24] <alexey.veselovsky> для потоковой как раз подходит. ибо у потока нет конца и позиционирование на произвольный символ там смысла не имеет
[21:54:43] <alexey.veselovsky> декодировка utf8 вообще отлично ложится на fpga. Это фактически hello world для fpga’шника
[21:55:19] <kpmý> но там получится хардварное представление символа неопределенным в какие-то моменты
[21:55:40] <kpmý> при этом ты даже не сможешь сделать прогноз
[21:55:50] <alexey.veselovsky> не страшно
[21:55:53] <kpmý> ведь конечное число бит зависит от каждого следующего
[21:55:58] <alexey.veselovsky> решается линией задержки
[21:56:11] <alexey.veselovsky> ладно, у отошел
[21:59:32] <kpmý> кстати лишний бит в строке которая формально содержит utf8 можно было бы использовать для уточнения позиционирования, это как key frame в видеосжатии, либо key либо нет, и тогда ищется первый key до этой позиции
[21:59:56] <kpmý> то есть вполне реально запилить эффективный utf8 на девятибитных единицах
[22:02:50] <kpmý> правда хер его знает, как организовать девятибитную хуйню как элемент массива
[22:16:00] <kpmý> а еще лучше 10 бит
[22:16:54] <kpmý> тогда в два бита можно уложить длину конкретного символа (1, 2, 3, 4 байта) и соответственно получить типа дайджест строки
[22:33:46] <geniepro> "Это мы можем наивно вывешивать банеры: "Дорогие жители Западной Украины! Если бы вдруг решили отделиться, то мы бы ни в коем случае не пошли вас за это убивать. НИ ЗА КАКИЕ ДЕНЬГИ!" Украинцы всё равно не поверят. Селянин всегда на страже, и знает, что на его грушу обязательно покушается кто-то из соседей. А потому нужно успеть ПЕРВЫМ отравить соседского хряка."
http://loboff.livejournal.com/456705.html
[22:44:21] <boris_ilov> "Хочете чашечку кави?"
[22:44:23] <boris_ilov> ахаха
[22:44:28] <boris_ilov> http://pcc.ludd.ltu.se/ftp/pub/pcc-docs/pcc-utf8-ver3.pdf
[23:12:59] <geniepro> http://bohemicus.livejournal.com/90590.html
[23:18:49] <geniepro> "Украина была Африкой до прихода русских, она стала Африкой после ухода русских. И она будет оставаться Африкой, пока туда не вернутся русские. Потому что никакой другой связи с европейской цивилизацией, кроме русской культуры и русского государства, у украинцев нет."