Потихоньку. Перекачал пдф документацию, теперь сижу вчитываюсь... не так всё грустно в датском королевстве...
Кстати, кто там утверждал про лечебницы? Одно из подразделений IBM, точнее Focal Point, использует для хранения Cache, потому как надо обеспечить одновременный доступ 10_000 пользователей и хранение от 6 до 10 Тб данных... перенос описаний Java объектов занял ... 15 минут.
Хотел бы понять, что я недорабатываю, не использую базы данных
Если в работе только дерево файлов, и у Вас оно требуется только для передачи, то БД, скорее всего, и не нужна. Вопрос БД возникает когда что-то, где-то, как-то надо хранить. Если "что-то" - велико, сложно структруировано и надо не только хранить, но еще и быстро(!) находить только(!) то, что нужно. А уж "дорабатываете" или нет - Вам решать.
Для нормальной работы "автоответчика" надо хранить достаточно большой объем развесистой структуры данных, начиная от словаря лексем и до наборов фраз, тем и т.д. и находить во всем этом то, что нужно (и только) за разумное время... так средний словарь слов русского языка - это около 40-100 тысяч слов, у каждого слова есть несколько словоформ - 0..15, средняя длина слова 8.2 буквы, средняя длина фразы 6-12слов и т.д. Это всё взято на просторах инета. Можете поискать сами... а еще есть такая беда как N-грамма, правила грамматики и прочие связи... грубо оцененный мной объем хранения от 200 Гб...
Проблема в том, что хранение в реляционных таблицах приводит к дикой потере места и скорости доступа. Проверено. Оптимально - сильноветвящиеся деревья. Вот и искал такую СУБД. Нашел.
Самое прикольное то, что эта СУБД без особых изменений эксплуатируется с 1979года... как я о ней раньше ничего не знал? До сих пор не могу понять...
Пока чем больше читаю, тем больше убеждаюсь, что это именно то, мне было нужно. Но язык.... Кстати, объектно-классовая надстройка языка Cache над Mumps - фигня достаточно слабая... и приводит к существенной потере скорости...
Кстати, кто там утверждал про лечебницы? Одно из подразделений IBM, точнее Focal Point, использует для хранения Cache, потому как надо обеспечить одновременный доступ 10_000 пользователей и хранение от 6 до 10 Тб данных... перенос описаний Java объектов занял ... 15 минут.
Хотел бы понять, что я недорабатываю, не использую базы данных
Если в работе только дерево файлов, и у Вас оно требуется только для передачи, то БД, скорее всего, и не нужна. Вопрос БД возникает когда что-то, где-то, как-то надо хранить. Если "что-то" - велико, сложно структруировано и надо не только хранить, но еще и быстро(!) находить только(!) то, что нужно. А уж "дорабатываете" или нет - Вам решать.
Для нормальной работы "автоответчика" надо хранить достаточно большой объем развесистой структуры данных, начиная от словаря лексем и до наборов фраз, тем и т.д. и находить во всем этом то, что нужно (и только) за разумное время... так средний словарь слов русского языка - это около 40-100 тысяч слов, у каждого слова есть несколько словоформ - 0..15, средняя длина слова 8.2 буквы, средняя длина фразы 6-12слов и т.д. Это всё взято на просторах инета. Можете поискать сами... а еще есть такая беда как N-грамма, правила грамматики и прочие связи... грубо оцененный мной объем хранения от 200 Гб...
Проблема в том, что хранение в реляционных таблицах приводит к дикой потере места и скорости доступа. Проверено. Оптимально - сильноветвящиеся деревья. Вот и искал такую СУБД. Нашел.
Самое прикольное то, что эта СУБД без особых изменений эксплуатируется с 1979года... как я о ней раньше ничего не знал? До сих пор не могу понять...
Пока чем больше читаю, тем больше убеждаюсь, что это именно то, мне было нужно. Но язык.... Кстати, объектно-классовая надстройка языка Cache над Mumps - фигня достаточно слабая... и приводит к существенной потере скорости...
Потихоньку. Перекачал пдф документацию, теперь сижу вчитываюсь... не так всё грустно в датском королевстве...Кто говорит, что грустно. Там всё весело,
Кстати, кто там утверждал про лечебницы? Одно из подразделений IBM, точнее Focal Point, использует для хранения Cache, потому как надо обеспечить одновременный доступ 10_000 пользователей и хранение от 6 до 10 Тб данных... перенос описаний Java объектов занял ... 15 минут. ;)
траву не надо будет покупать!
Гы, я чуть со стула не упал от такой наивной веры во всё написанное.
Это после многолетнего курса реабилитации от загрузки и чтения pdf или после?
Имея за плечами, т.е. на руках, сертификат Cache' и сертифицированное обучение сертифицированным преподавателем Cache',
и после анализа скрытых смыслов и наколок,
я пришёл к выводу,
что под переносом имеется ввиду fast format, т.е. быстрая переразметка ждиска.
Для нормальной работы "автоответчика"...Вы замахнулись на Нобелевскую премию,
претендуя опередить исследовательские подразделения всех компаний мира!
Проблема в том, что хранение в реляционных таблицах приводит к дикой потере места и скорости доступа.Это не проблемМа. Это известная дилемма быстродействие/эффективность vs. избыточность/место.
Самое прикольное то, что эта СУБД без особых изменений эксплуатируется с 1979года... как я о ней раньше ничего не знал? До сих пор не могу понять...Учитывая, что я программировал в Cache' в 2003 и ничего не изменилось с 1879 г., можете опереться на мой опыт, что никому в голову не приходит тратить время на описание проблем и несуразиц с Cache'.
Пока чем больше читаю, тем больше убеждаюсь, что это именно то, мне было нужно. Но язык.... Кстати, объектно-классовая надстройка языка Cache над Mumps - фигня достаточно слабая... и приводит к существенной потере скорости...Только в этом проблема?
Если у Вас произойдёт малейшее corruption of db (даже в одном байте) у Вас пропадут все Ваши террабайты,
и ничего Вы с этим не сможете сделать.
Заодно и всю Cache' yalj будет переустанавливать
Кстати, как там incremental бэкапы делаются, поинтересуйтесь, откроете для себя много интересного!
Вот, возвращаясь к семантическому смыслу задачи,
посм.
http://wapedia.mobi/en/Metacrap
(или
http://www.well.com/~doctorow/metacrap.htm
в оригинале)
И то, что сказал основатель интернета:
http://en.wikipedia.org/wiki/Semantic_Web
"I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize.
– Tim Berners-Lee, 1999"
А неззя вначале proof-of-concept prototype без всяких заморочек с хранением сделать
посм.
http://wapedia.mobi/en/Metacrap
(или
http://www.well.com/~doctorow/metacrap.htm
в оригинале)
И то, что сказал основатель интернета:
http://en.wikipedia.org/wiki/Semantic_Web
"I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize.
– Tim Berners-Lee, 1999"
А неззя вначале proof-of-concept prototype без всяких заморочек с хранением сделать
Вы уже второй раз упоминаете о своих познаниях и опыте в Cahce. Большая просьба (дабы сэкономить время) - не могли бы Вы просто и доходчиво рассказать о тех проблемах, которые Вы считаете серьезными. Вот Вы сказали, что Cache - "жутко ненадежен" и риск "всё потерять" слишком велик. Очень хочется услышать по-подробнее. Да и еще что там "подразумевается" не то, что пишется? Тоже, если не трудно - осветите попродробнее. А то вдруг эта фигня еще и не работает вовсе...
Кстати, что же всё-таки можете посоветовать вместо Cache? Вы так и не ответили на этот вопрос...
Кстати, что же всё-таки можете посоветовать вместо Cache? Вы так и не ответили на этот вопрос...
Может Вам предложить уже готовую библиотеку для лексического анализа? Опасаюсь я за Ваш рассудок, коллегаУверен, она Вам сильно облегчит жизнь. Просто я как-то несколько лет назад уже пытался решить подобную задачу. Увлекательно, но забота о хлебе насущном задвинула её в архив.
Гы. Было дело дело. Сам опасался лет так 8 назад. Теперь уже - нет. Поздно пить боржоми...
Вопрос ananas'у:
Поставил Loopback, Apache и запустился Cache. Но при соединении с сервером Cache Studio пишет "Не могу соединиться с сервером. Access denied. //Localhost[1972]" При ручном подключении запрашивает пароль для пользователя admin. И где его взять? Комп под Хрюшей, стоит локально и без сетевых соединений (ваще без сетевой карты). Пользователь admin в системе пароля не имеет...
При этом, странички с администрированием, документацией и Getting started в Explorer - выводит исправно... чего не так?
Есть возможность поставить под Убунтой... хотел сначала опробовать виндовый вариант...
Поставил Loopback, Apache и запустился Cache. Но при соединении с сервером Cache Studio пишет "Не могу соединиться с сервером. Access denied. //Localhost[1972]" При ручном подключении запрашивает пароль для пользователя admin. И где его взять? Комп под Хрюшей, стоит локально и без сетевых соединений (ваще без сетевой карты). Пользователь admin в системе пароля не имеет...
При этом, странички с администрированием, документацией и Getting started в Explorer - выводит исправно... чего не так?
Есть возможность поставить под Убунтой... хотел сначала опробовать виндовый вариант...
Сейчас читают
А что там с Windows 8 ?
22326
54
геймс
67856
236
Ждать любви или выходить за нелюбимого
30433
174
Вопрос ananas'у:С каким сервером (сервером чего)?
Поставил Loopback, Apache и запустился Cache. Но при соединении с сервером Cache Studio пишет "Не могу соединиться с сервером. Access denied. //Localhost[1972]" При ручном подключении запрашивает пароль для пользователя admin. И где его взять? Комп под Хрюшей, стоит локально и без сетевых соединений (ваще без сетевой карты)
. Пользователь admin в системе пароля не имеет...
При этом, странички с администрированием, документацией и Getting started в Explorer - выводит исправно... чего не так?
Как Вы думаете - какой сервер показывает документацию?
И, при чём тут пользователь системы к пользователю, под которым работаёт сервер?
Как бы Вам вежливо ответить " чего не так?"?
Я на такие вопросы (проекты на фрилансерских сайтах) за деньги никогда не берусь,
даже в областях, в которых сейчас активно работаю и администрирую, а Cache я занимался 6 лет назад
Тему для себя закрыл.
И, возвращаться не собираюсь
Сделать правильно гораздо меньше вариантов,
чем напортачить. И, потом, никогда не додумаешься, что там кто-то мог "навыдумывать".
Вы писали ранее, что у Вас на компе не установлены сетевые протоколы.
Из моего опыта могу сказать, что если Вы устанавливаете studio или framework, зависящие от протоколов, сервисов, серверов, библиотек, то их надо установить вначале или же потом регистрировать с тем, что Вы устанавливаете потом
По поводу других вопросов - я тоже отвечал ранее.
Никакие самые распрекрасные Тулзы Вам мозги не заменят и возможности всё сделать через тот самый проход не предотвратят.
Вы сделайте, для начала, без базы данных... хотя бы с пустой функциональностью
При этом, странички с администрированием, документацией и Getting started в Explorer - выводит исправно... чего не так?Я не помню, как там в Cache',
но здравый смысл мне подсказывает, что
выводить статичные веб странички (или pdf-ы) никакой сервер обычно не нужен
Как, впрочем, и для Вашего бота...
Спасибо за полный и развернутый комментарий. Думаю, что теперь уже смогу справиться самостоятельно. Тему для себя еще раз закрыл.
Проблема в том, что хранение в реляционных таблицах приводит к дикой потере места и скорости доступа. Проверено. Оптимально - сильноветвящиеся деревья. Вот и искал такую СУБД. Нашел.Это называется полнотекстовое индексирование и реализовано в совеременных субд. Все придумано до нас.