APRICOT 2026 Почти 30 лет проект PingER в Национальной ускорительной лаборатории США SLAC ежедневно отправлял тысячи ping-запросов, чтобы измерить время, которое требуется пакету данных для прохождения полного пути между двумя узлами в интернете.
Но в 2024 году последний сотрудник, работавший над проектом, вышел на пенсию, и SLAC закрыла его без плана по сохранению или обмену собранными данными.
К счастью, узкое исследовательское сообщество, занимающееся сетями, узнало о закрытии PingER. Тут появился Джим Коуи, ученый-компьютерщик, преподаватель и предприниматель.
В последнем качестве Коуи основал компанию Renesys, которая с 2000 по 2014 год собирала и продавала информацию об интернет-инфраструктуре — можно считать ее предшественницей сервиса Radar от Cloudflare.
Компания Dyn приобрела Renesys в 2014 году, а затем сама была приобретена Oracle. В ходе внутренней реорганизации, последовавшей за двумя приобретениями, большая часть данных, собранных Renesys за годы, была утеряна.
«Со временем информация имеет тенденцию исчезать. Если вы не вкладываете средства, она по умолчанию умирает», — сказал Коуи изданию The Register.
Потеря данных раздражает Коуи, который на этой неделе на Азиатско-Тихоокеанской региональной конференции по сетевым технологиям (APRICOT) заявил, что, по его мнению, «операционные отходы интернета» могут помочь человечеству понять, что сетевые системы сделали с обществом.
«Если бы мы хотели понять, совпадают ли человеческий и технический прогресс, как бы мы это сделали?» — спросил он во время своего основного доклада. «Настали опасные времена. Все меняется, и мы не знаем как».
Коуи считает, что историки смогут начать отвечать на эти вопросы, изучая данные, собранные такими проектами, как PingER, Renesys и другими, которые собирают данные об операциях в интернете.
Поэтому он запустил проект по сохранению этих файлов для потомков.
Проект называется Internet History Initiative (IHI), и, по словам Коуи, его миссия — выявлять и сохранять записи, которые позволят будущим поколениям рассказать историю интернета и его влияния. Он считает, что в проекте должны участвовать архивариусы, библиотековеды, технологи и другие специалисты, работающие во многих учреждениях.
Основной деятельностью проекта будет применение принципа LOCKSS — Lots of Copies Keep Stuff Safe («Много копий сохраняют информацию»), для хранения данных в автономном режиме с использованием методов, которые обеспечат их сохранность в течение столетия. Коуи полагает, что IHI потребуется распределенная группа участников проекта, которые будут хранить части коллекции, а также федеративный уровень, обеспечивающий обзор всех хранящихся наборов данных. Он также предусматривает еще одну версию коллекции в «теплом» хранилище, чтобы исследователи могли получить к ней доступ.
Он оптимистично настроен, что IHI сможет создать такой ресурс, поскольку подобные коллекции уже существуют.
«Люди из RIPE NCC десятилетиями хранят данные маршрутизации и активные данные о производительности и систематизируют их», — сказал Коуи.
Он также указал на проект RouteViews Орегонского университета, который архивировал почти 30 лет данных маршрутизации протокола BGP (Border Gateway Protocol) и делает их доступными для исследователей.
Координатор по пирингу этого проекта, Нина Баргисен, заявила, что RouteViews уже осведомлен о IHI, считает его цели схожими с собственными и не видит причин, по которым ее организация не захочет участвовать и помогать.
«Есть, вероятно, полдюжины или дюжина подобных организаций, обладающих подобным опытом», — сказал Коуи, и если они объединят свои знания, у IHI будет достаточно ресурсов для работы. «Мы ни в коем случае не начинаем с нуля».
Действительно, IHI уже сохранил некоторые наборы данных из RIPE и восстановил данные PingER из SLAC.
Организация также определила данные, которые она хочет сохранить, и некоторые данные, которые, как опасается, уже могут быть утеряны.
Коуи сообщил The Register, что ему известно об академической статье, описывающей исследовательский проект, в рамках которого анализировался каждый пакет данных, переданный из США в Великобританию в течение двух часов. Статью по-прежнему легко найти, сказал он, но описанные в ней данные исчезли.
Он надеется, что кто-то знает, где можно найти эти данные и другие подобные им коллекции. «Подумайте о людях, которых вы знаете, у кого есть старые traceroutes или файлы зон на магнитных лентах или в шкафу», — сказал он, а затем попросил их связаться с проектом.
Он также открыт для информации о новых источниках данных. The Register отметил, что сетевые вендоры собрали десятилетия данных, описывающих использование их продуктов клиентами, и что у Cisco настолько много данных, что она обучила собственные LLM. Коуи, казалось, был заинтригован возможностями, которые такие данные открывают для IHI.
IHI потребуются друзья и финансирование. Баргисен из RouteViews сказала, что если кто-то и сможет добиться успеха, то это Коуи. Сам Коуи сообщил, что ведет переговоры с различными сторонами, но пока слишком рано говорить о том, как будет организован проект.
Но он призвал всех заинтересованных подписаться на его рассылку и следить за новостями. ®
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Simon Sharwood




