Ежегодно количество пользователей Интернета и социальных сетей увеличивается на несколько сотен миллионов человек. Сейчас более 60% всего населения Земли находится в сети, и все эти 4,5 миллиарда человек беспрерывно генерируют новый контент. Фотографии, видеоролики, документы и даже банальная переписка с друзьями в соцсетях занимает немало места в цифровом пространстве.
Значительная часть генерируемых данных является ничем иным, как «цифровым мусором». Забытые в облаке данные, многочисленные копии файлов, кэш приложений и т.п. Объем цифрового мусора постоянно растет, причем не только за счет новых пользователей, но и ввиду утяжеления самой информации. Самый простой пример: 20 лет назад фото весили около 1 МБ, сейчас же средний показатель равняется 3,5 МБ. Рост блогерского сообщества, улучшение качества фото- и видеоконтента, бесконечное копирование одного и того же текстового материала, переписки, сториз и т.д. — рано или поздно хранилища переполнятся.
Закон Мура не работает — прогресс стоит на месте
Данные растут, а объем накопителей практически нет. Закон Мура, сформулированный в 1968 году, гласящий о ежегодном двукратном приросте объема памяти, перестал работать в 2007 году. Сейчас HDD диск на 20 ТБ является пределом для потребителей, а стоимость такого накопителя в российских реалиях превышает 50 000 рублей. Планы Seagate и Western Digital выпустить 50 ТБ жесткие диски не ранее 2026 года еще раз подтверждают несостоятельность закона Мура. С SSD ситуация не лучше — эти накопители хоть и могут конкурировать с HDD, предлагая до 100 ТБ места, но стоимость их просто космическая (например, SSD на 12,8 ТБ стоит от 270 000 рублей).
Естественно, что ученые разрабатывают и более емкие носители информации, о которых мы рассказывали ранее. Например, усовершенствованные магнитные ленты или кварцевое стекло, но эти разработки появятся в широком доступе не ранее, чем через 5-10 лет. О накопителях на основе ДНК, способных вмещать свыше 500 млн ТБ информации, в обозримом будущем не приходится говорить и вовсе. Такое чудо если и появится, то явно не в 21 столетии.
Проблема облачных хранилищ
Все больше информации переходит с домашнего хранения в облако. Вес данных растет, а значит неизбежен коллапс дата-центров, если не принять меры. Ведь построить новый центр обработки данных (ЦОД) — это не одного дня дело, да и подобные мероприятия не дешевые, а в некоторых местах и вовсе стоят заоблачных денег.
Ярким примером служит Гонконг. На территории в 1100 кв. км проживает более 7 млн человек. Из-за этого земельные участки там сверхдорогие, а недвижимое имущество постоянно находится в топе мировых рейтингов по стоимости. Строить ЦОД в Гонконге крайне затратно, поэтому там активно разрабатываются проекты по развертке хранилищ под землей — в пещерах. Гонконгцы не одни такие — власти Норвегии также продвигали аналогичное решение. Но вот незадача — последние упоминания о постройке дата-центров в пещерах датируются 2013 годом. Оно и не удивительно, поскольку такие проекты стоят намного дороже, чем классические наземные. Поэтому решать проблему переполнения дата-центров нужно иначе, и на этот счет есть несколько мыслей.
Первые шаги избавления от цифрового мусора
Раз мы говорим о цифровой индустрии, то здесь применимы как хардверные, так и софтверные решения проблемы. Вместо возведения новых ЦОД куда проще разработать новые алгоритмы сжатия данных. В этом направлении активно работает Google, Apple и другие IT-гиганты, оптимизируя и создавая новые алгоритмы кодирования файлов для снижения их веса.
Алгоритмы и кодеки
Тот же сервис потокового видео YouTube решил отойти от политики доступа к старым видео в низком разрешении. Если новые видеоролики сразу доступны во всех разрешениях, начиная от 144p, то старые хранятся на сервисе только в оригинале. Но если появится запрос на выведение картинки устаревших роликов в отличном от оригинала разрешении, алгоритмы сервиса моментально предоставят такую возможность (затем сжатое видео вновь удаляется). Также внедряются новые кодеки, и если лет 5 назад доминировал H.264, то сейчас на YouTube главенствует VP, в 5 раз более эффективный по сжатию относительно предшественника.
Дедупликация
Это процесс, позволяющий устранить копии информации, тем самым снижая расходы на ее хранение. Существует несколько методов дедупликации: на уровне блоков, файлов или байтов. Осуществляется процесс на мощностях клиента, сервера или в комбинированном режиме клиент-сервер. Тянет на отдельную статью, но важна суть, а заключается она в снижении количества ненужных копий в хранилищах — в теории объем лишних данных может снизиться до 20 раз! Если коротко и очень примитивно о принципе работы, то дедупликация сродни ярлыку на рабочем столе, который лишь ссылается на оригинальный файл.
Активные и пассивные хранилища
Система выглядит ровно так же, как это реализовано во множестве современных компьютеров пользователей: система и программы на SSD, а все остальное на жестком диске. Так же и в ЦОДах: часто используемые данные хранятся на быстрых SSD-дисках, а редко запрашиваемые переводятся на хранение на HDD.
Платная подписка
Халява и вседоступность всегда порождает транжирство. Так, если раньше на пленочных фотоаппаратах берегли каждый кадр, фотографируя только самые ценные моменты, то сейчас один поход в уборную у некоторых особей сопровождается тремя сотнями снимков.
Поэтому регулирование потока информации можно осуществить платной подпиской. Платное хранилище файлов сразу заставит человека подумать, что для него ценно, а что стоит без сожаления стереть. Подобная практика не нова: Dropbox, iCloud, Mega, диски Google/Яндекс и другие платные облачные хранилища существуют давно.
Стоит отметить, что Google до сих пор предоставляет безлимитное пространство для пользовательских фото и видео с применением минимального сжатия контента. Однако с 1 июня 2021 года политика компании изменится и любая загрузка станет лимитироваться бесплатными 15 ГБ, доступными для всех сервисов сразу: Диск, Gmail, Фото. Загрузка данных сверх лимита потребует оформления платного тарифа.
Цифровой мусор — вид с пользовательского ракурса
Захламленность Интернета имеет как положительные, так и отрицательные стороны для обычных юзеров. Главный минус — на поиск нужной информации уходит больше времени, так как одни и те же данные множатся на десятках сайтов в виде рерайта или копипаста без указания источника.
Из положительного — упрощается поиск графических элементов, особенно фото, за счет увеличения информационной базы. Поиск картинки по url-адресу и множественная выдача похожих изображений как раз заслуга цифрового мусора.
Мусор в Интернете негативно влияет не только на цифровое пространство, но и на физическое. Недавнее исследование Университета Бристоля в сфере электронных услуг говорит о том, что только загрузка видео на YouTube увеличивает выбросы CO2 до 300 тысяч тонн в год. Примерно такой же углеродный след генерирует 30 тысяч домов в Великобритании.
Как мы можем уменьшить количество цифрового мусора? Все до банальности просто.
- удаление ненужных файлов без откладывания в долгий ящик. Например, спам, чеки мелочных покупок, неудачные фото или видео;
- регулярная чистка старых, неактуальных диалогов в социальных сетях, удаление ненужных файлов, приложений и своевременное освобождение корзины электронных почт;
- упорядоченность в цифровом пространстве: структуризация и каталогизация файлов. Хватит уже лень и расхлябанность прикрывать знаменитой цитатой А. Эйнштейна про властвование над хаосом;
- уменьшение потребления контента, устраивая дни отдыха от Интернета и социальных сетей.
Порядок потребен лишь глупцу, гений властвует над хаосом
Любые ресурсы конечны, помните это, поэтому давайте максимально отдалим тот час, когда точка невозврата будет пройдена.
Это тоже интересно: