Первое место и призовые $50 тысяч завоевала команда программистов из Сан-Франциско под названием «Все ваши обрезки принадлежат США» (All Your Shreds Are Belong To U.S.). Она быстрее и точнее соперников собрала все пять пазлов, то есть документов, разрезанных в общей сумме на 10 тысяч тонких полосок. И ещё она первой ответила на связанные с загадками вопросы относительно городов и людей, упоминаемых в текстах.
Исходный и реконструированный победителем текст номер 1. Он был разбит всего на 224 кусочка (дальше степень измельчения пазлов шла по нарастающей), потому данную бумагу команда собрала уже 6 ноября (иллюстрация Shredder Challenge/DARPA).
Ключом к успешному решению задания оказалось сочетание чисто машинного подхода (сортировка и сравнение фрагментов) с творческой работой людей-сборщиков, сообщает устроившее конкурс агентство DARPA. Программа-победитель подбирала отсканированные кусочки бумаг друг к другу лишь вчерне и предъявляла пары для проверки членам команды.
Последние не просто по буквам отслеживали верные сочетания соседних полосок, а использовали по ходу восстановления документов разбросанные по ним подсказки, то есть обращали внимание на смысл складывающихся головоломок.
К примеру, в первом тексте упоминается название фильма, который снял режиссёр Анатоль Литвак в 1937 году. В энциклопедии можно узнать, что в данном году Литвак выпустил две ленты – «Товарищ» и «Женщина, которую я люблю». Товарищ по-английски – comrade, и это как раз то слово, с которого начинается первый документ.
Победитель соревнования по реконструкции текстов, пропущенных через шредер, стал известен намного раньше, чем ожидалось. Чемпионы-сыщики проявили изобретательность и смекалку.
Стартовавший в конце октября конкурс по воссозданию измельчённых документов Shredder Challenge завершён.
Первое место и призовые $50 тысяч завоевала команда программистов из Сан-Франциско под названием «Все ваши обрезки принадлежат США» (All Your Shreds Are Belong To U.S.). Она быстрее и точнее соперников собрала все пять пазлов, то есть документов, разрезанных в общей сумме на 10 тысяч тонких полосок. И ещё она первой ответила на связанные с загадками вопросы относительно городов и людей, упоминаемых в текстах.
Исходный и реконструированный победителем текст номер 1. Он был разбит всего на 224 кусочка (дальше степень измельчения пазлов шла по нарастающей), потому данную бумагу команда собрала уже 6 ноября (иллюстрация Shredder Challenge/DARPA).
Ключом к успешному решению задания оказалось сочетание чисто машинного подхода (сортировка и сравнение фрагментов) с творческой работой людей-сборщиков, сообщает устроившее конкурс агентство DARPA. Программа-победитель подбирала отсканированные кусочки бумаг друг к другу лишь вчерне и предъявляла пары для проверки членам команды.
Последние не просто по буквам отслеживали верные сочетания соседних полосок, а использовали по ходу восстановления документов разбросанные по ним подсказки, то есть обращали внимание на смысл складывающихся головоломок.
К примеру, в первом тексте упоминается название фильма, который снял режиссёр Анатоль Литвак в 1937 году. В энциклопедии можно узнать, что в данном году Литвак выпустил две ленты – «Товарищ» и «Женщина, которую я люблю». Товарищ по-английски – comrade, и это как раз то слово, с которого начинается первый документ.
Загадка номер пять была самой сложной во всей серии. Здесь было разрезано и перемешано сразу три листка бумаги (на фото показан только третий — до измельчения и после восстановления).
Один из трёх листов был исполосован в направлении, перпендикулярном двум другим, а общее число кусочков составило более шести тысяч! Вдобавок небольшая часть текста представляла собой морзянку в виде нагромождения повторяющихся слов dit и dah. Над этой головоломкой команда победителей колдовала до 29 ноября (иллюстрация Shredder Challenge/DARPA).
Собрав третий документ (на фото под заголовком), участники должны были назвать судьям задуманный в загадке город — Сьенфуэгос.
Интересно, что напрямую в документе этот город не упоминался, но зато там были указаны географические координаты Гаваны, нарисованы очертания Кубы и дан набросок весьма известного городского парка Сьенфуэгоса.
Исходный документ номер 3 и скрытые в нём подсказки. Данная бумага была разрезана на 1115 кусочков (иллюстрация Shredder Challenge/DARPA).
При выборе победителя учитывалось не только первенство в сборке пазлов. За те или иные правильные ответы на вопросы по содержанию документов судьи начисляли дополнительные баллы. Группа All Your Shreds Are Belong To U.S. оказалась лучшей не только в деле программирования, но и просто эрудиции, сообразительности.
Задача номер два. Умеренное число обрывков – всего 373 — позволило победителям восстановить этот документ быстро и практически на 100% (иллюстрация Shredder Challenge/DARPA).
Своё последнее решение из серии заданий команда из Сан-Франциско прислала всего через 33 дня после анонса конкурса. На составление алгоритма машинного зрения и сортировки обрывков, а также собственно на сборку бумаг умельцы потратили 600 человеко-часов.
Между тем перед стартом соревнования некоторые эксперты DARPA считали предложенные загадки практически нерешаемыми, во всяком случае в столь сжатые сроки.
Однако победители не только опровергли все прогнозы, но и наглядно показали, как из измельчённой мешанины бумаг можно извлекать читабельный текст и разбираться в его смысле даже при недостаче частей документа. А ведь именно это и было нужно инициаторам конкурса, представлявшим интересы военных и спецслужб.
Четвёртый пазл (порезанный на 2340 кусочков) поддался победителям лишь частично. Но и восстановленных фрагментов хватило для того, чтобы узнать «имена учёных», работавщих над «секретным проектом» (иллюстрация Shredder Challenge/DARPA).
Однако непонятно зачем вообще измельчать документы перед сжиганием, ведь сделать это после выйдет даже лучше, сгоревшие останки документов можно будет превратить в практически однородную пыль. И тогда никакие компании и компьютерные программы в ближайшем будущем не смогут восстановить текст.
> Однако непонятно зачем вообще измельчать документы перед сжиганием, ведь сделать это после выйдет даже лучше, сгоревшие останки документов можно будет превратить в практически однородную пыль. И тогда никакие компании и компьютерные программы в ближайшем будущем не смогут восстановить текст.
> Однако непонятно зачем вообще измельчать документы перед сжиганием,
В некоторых организациях документы сжигаются централизовано отдельно выделенными людьми, у которых может отсутствовать необходимый уровень допуска к содержимому сжигаемых документов.
> Однако непонятно зачем вообще измельчать документы перед сжиганием, ведь сделать это после выйдет даже лучше, сгоревшие останки документов можно будет превратить в практически однородную пыль. И тогда никакие компании и компьютерные программы в ближайшем будущем не смогут восстановить текст.
Затем, чтобы те кто сжигает не читали документы перед сожжением. Если по всё людски - доки пропускают через шредер, лапшу в ящик. Вечером специальная уборщица сжигает лапшу. А каждый документ жечь - немного неудобно.
> В некоторых организациях документы сжигаются централизовано отдельно выделенными людьми, у которых может отсутствовать необходимый уровень допуска к содержимому сжигаемых документов.
> Возможно, в любом более или менее крупном посольстве?
Я не знаю, мне интересно. Камрад пишет - значит знает. По моему опыту документы уничтожались специальными комиссиями, все члены которых имели соответствующие допуска.
> Однако непонятно зачем вообще измельчать документы перед сжиганием, ведь сделать это после выйдет даже лучше, сгоревшие останки документов можно будет превратить в практически однородную пыль. И тогда никакие компании и компьютерные программы в ближайшем будущем не смогут восстановить текст.
затем, что сжигать листы с текстом должен тот, у кого есть допуски к этому тексту
а перемешанную кучу бумажных обрезков можно поручить сжигать менее ответственным людям
> затем, что сжигать листы с текстом должен тот, у кого есть допуски к этому тексту
> а перемешанную кучу бумажных обрезков можно поручить сжигать менее ответственным людям
Неправильно это. Тот, кто сжигает, должен удостовериться, что сжигается именно то, что должно быть уничтожено. Это ведь всё актом оформляется. Соответственно, если и измельчается, то в присутствии комиссии, на месте уничтожения и непосредственно перед сжиганием.
> Однако непонятно зачем вообще измельчать документы перед сжиганием
Чисто практически - попробуй пожечь бумагу в больших количествах. Старый телефонный справочник, например. Мне как-то раз поручили спалить архив небольшой, так я заколебался. Жечь приходилось чуть ли не по одному листочку, бумага в стопке, даже небольшой, обгорает только по краям, а внутри практически целая. Жечь "дождик" из шрёдера гораздо проще и надёжнее.
> Однако непонятно зачем вообще измельчать документы перед сжиганием,
Тут ещё такой момент, что спрессованную бумагу тяжело сжечь. Пробовал когда-нибудь тетрадки палить, например? Различные папки с документами проще пропустить через шредер сперва, чтобы "распушить" бумагу перед тем, как жечь. Ну и да, вопросы допуска, которые привели выше.
Камрад, я конкретных названий и примеров приводить в интернетах не стану, не обессудь.
В основном это там где есть допуска, но сами организации штатские. И там, где документы расходуются относительно регулярно, когда комиссий на каждый документ не насобираешся, а сами документы уровня ДСП копить смысла нет.
Там, где я сейчас тружусь, например, лапшу из черновиков и отработанных документов по некоторым проектам сжигают под присмотром вобще отдельно приглашаемые фирмы.
Не на том акцентируетесь.
Это ж по сути сложнейший паззл.
Победители, кроме усидчивости, использовали некоторые алгоритмы для ускорения процесса. И эти алгоритмы пригодятся не только и не столько восстанавливателям документов(судя по unshredder.ком, услуга имеет свой рынок), но и для решения других задач. И OCR - самое очевидное.
Молодцы ребята!
> измельчённые документы по инструкции надо сжигать.
Совсем необязательно, видел я "шредер", который раньше стоял в обкоме. 2 вращающиеся металлические щётки, документы превращались в мелкую труху, фрагменты не более 0.5 мм.
Таким способом за очень дешево гос.службы получают технологии восстановления документов. В этих конкурсах участвуют обычно студенты и таким образом выявляют потенциальных кандидатов для приема на работу в аналитические отделы спецслужб. Дешево и сердито.
Помнится в Иране лет 30 назад, когда из посольства американцы удирали, то документы пропустили через шредер, но не сожгли. Персы потом посадили толпу женщин паззлы собирать, говорят собрали все. Не знаю уж, дали ли им какой нибудь приз за это :)
на грани бреда... представил шредер сканирующий опущеный на уничтожение документ, сохраняющий его в флеш память и пересылающий по G3 G4 сетям куда надо XD
> Пробовал когда-нибудь тетрадки палить, например? Различные папки с документами проще пропустить через шредер сперва, чтобы "распушить" бумагу перед тем, как жечь.
Насколько меня не подводит память не знаю, но всплывает, что на соревнованиях топовый уровень измельчения - кусочки 1мм на 4 мм. Насколько меня опять-таки не подводит память у нас (в России) топовые документы положено мельчить 1мм на 1 мм. Ну а потом сжигать, да.
Разумеется идиотии, все ж инструкциям следуют неукоснительно. Все всё сжигают, а если поджечь нечем, то просто сжирают.
Как сотрудник службы безопасности банка сообщаю, что у нас вся ключевая и конфиденциальная информация уничтожается в сертифицированном шрэдере. Подобные соревнования являются началом долгой и серьезной работы по восстановлению уничтоженных документов. Аналогичные по идеологии соревнования проводит НАСА по создания космического лифта и троса.
Дмитрий Юрьевич, это был не конкурс на восстановление документов, а соревнование программированию. Darpa такие мероприятия часто устраивает, чтобы толковых студентов на заметку взять. ИМХО, было бы не плохо нашим ВУЗам и предприятиям ВПК этот опыт у себя внедрить.
А надежное уничтожение документов- это уже другая история.
> Праздник идиотии — измельчённые документы по инструкции надо сжигать.
Для спец. служб может быть так, но коммерческие организации зачастую пользуются услугами компаний уничтожающих документы, потому что организовывать в центре города домну никто не позволит. В итоге документы измельчаются, вывозятся на грузовиках и затем уже уничтожаются.
> Помнится в Иране лет 30 назад, когда из посольства американцы удирали, то документы пропустили через шредер, но не сожгли. Персы потом посадили толпу женщин паззлы собирать, говорят собрали все. Не знаю уж, дали ли им какой нибудь приз за это :)
Мне кажется в Ираке, сравнительно недавно и наоборот. Штаты складывали.
> Darpa такие мероприятия часто устраивает, чтобы толковых студентов на заметку взять.
у DARPA что ни соревнование, то в "оружие будущего" сюжетец. Автомобили то они научили самостоятельно ездить по городу. Теперь старые Хамви будут переделываться в роботов ... А по началу был спорт.