CNews Cloud: Облачные сервисы

Хранилище Google ограничило в правах владельцев файлов, созданных на макбуках

Интернет Веб-сервисы Техника Облака
, Текст: Дмитрий Степанов
Сервис Google Drive вновь находит случаи нарушения авторских прав там, где их скорее всего нет и быть не может. Популярное облачное хранилище автоматически ограничивает возможности работы с файлами метаданных, которые создает файловый менеджер операционной системы macOS, причем без возможности апелляции. Месяцем ранее пользователи массово жаловались на аналогичную проблему с файлами, которые не содержат ничего, кроме простейшей комбинации из одной-трех цифр. Google тогда заявила, что все починила.

Google Drive опять чудит

Сервис Google Drive («Google диск») начал помечать некоторые совершенное безобидные служебные файлы операционной системы Apple macOS как нарушающие авторские права неопределенного круга лиц. Издание Bleeping Computer зафиксировало три подобных случая, однако проблема может носить и более массовый характер.

Пользователям, столкнувшимся с ней, на электронную почту приходит уведомление о том, что один из хранящихся в облаке Google файлов содержит информацию, защищенную копирайтом. Кто именно является правообладателем и чьи интересы были затронуты, сервис не уточняет. Google автоматически накладывает ограничения на такие файлы. В частности, ими нельзя поделиться с другим пользователем, хотя можно загрузить на свой компьютер.

Недоумение получивших такие письма людей вызывает то, что угрозу алгоритмы Google видят в служебном файле macOS, под управлением которой работают компьютеры фирмы Apple, с именем “.DS_Store”. Неприятное удивление может вызывать и отсутствие возможности подать апелляцию на решение, явно вынесенное машиной.

Зачем нужны файлы “.DS_Store”

Файлы “.DS_Store” автоматически генерируются приложением Finder, которое является системным файловым менеджером в операционной системе macOS. Такие файлы содержат атрибуты и метаданные каталогов файловой системы, такие как параметры положения значков или фоновое изображение.

google.jpg
Алгоритмы Google вновь ошибаются при выявлении нарушителей копирайта

В операционных системах семейства Windows схожее назначение имеют файлы “desktop.ini” (настройки внешнего вида папки) и “thumbs.db” (миниатюры изображений папки для режима «Эскизы страниц» в «Проводнике»).

Как и Windows-аналоги, файлы “.DS_Store” по умолчанию невидны пользователям в «родной» среде. Однако же облачные хранилища, как правило, игнорируют атрибуты и отображают любые файлы, даже если те содержат исключительно служебную информацию.

Виноваты контрольные суммы?

Как отмечает Bleeping Computer, пока с уверенностью нельзя сказать, с чем связано такое странное поведение Google Drive.

Специалисты издания не смогли воспроизвести баг, однако выдвинули весьма правдоподобную версию того, почему облачное хранилище считает совершенно безобидные файлы посягающими на копирайт.

Возможно, все дело в том, что алгоритмы Google, проверяющие загружаемую пользователями информацию на предмет нарушения авторских прав, основывают свои выводы на результатах сверки контрольных сумм (checksums). То есть сравнивают хеш-код пользовательского файла с находящимся в собственной базе данных хеш-кодом файлов, защищенных авторским правом. Совпадение кодов в таком случае является основанием считать, что и содержимое исходных файлов совпадает. Однако хеширование разных исходных данных может давать одинаковый результат в силу специфики алгоритмов хеширования.

Связь с январской проблемой

В январе 2022 г. пользователи Google Drive жаловались на похожую проблему. Тогда сервис помечал как нарушающие авторские права файлы, содержащие лишь единицу («1» – с символом возврата каретки или без него). Примечательно, что подобным же образом, Google реагировал не только на единицу. Доктор Крис Джефферсон (Dr. Chris Jefferson), исследователь из Сент-Эндрюсского университета (Великобритания), написал в своем Twitter, что Drive также невзлюбил числа 173, 174, 186, 266, 285, 302, 336, 451, 500 и 833. Установить какую-либо закономерность между ними ученому не удалось.

Теория контрольных сумм также неплохо объясняет наличие сложностей с воспроизведением ситуации, в которой Google Drive решает отнести файлы типа “.DS_Store” к нарушающим копирайт. Такие файлы, в отличие от несущих в себе короткую последовательность цифр, могут иметь уникальное содержимое, которое зависит от параметров конкретного каталога на конкретном компьютере, поэтому и его хеш с меньшей вероятностью окажется в базе Google.

Сама же Google детальную информацию по данному вопросу предоставлять отказывается. Январская проблема, по информации ИТ-гиганта, решена. Кроме того, были предприняты шаги, направленные на предотвращение ее возникновения в будущем. Тем не менее, представитель компании в разговоре с Bleeping Computer косвенно подтвердил, что пользователи могут сталкиваться с неадекватной реакцией алгоритмов выявления нарушений копирайта в «граничных случаях».