Лавинообразный рост неупорядоченных данных начал тревожить экспертов

Лавинообразный рост неупорядоченных данных начал тревожить экспертов

03.12.2018     

Объем неструктурированных данных растет в 10 раз быстрее, чем упорядоченных. Специалисты опасаются, что без технологий обработки этого массива информации развитие цивилизации остановится.

Стремительный рост

Аналитики компании Igneous пришли к выводу, что почти половина ЦОДов Северной Америки сталкивается с задачей обработки большого объема неупорядоченных данных. 59% дата-центров управляют более чем 10 млрд файлов, а каждый год их объем растет на 23%. Такие сведения представлены в «Государственном докладе, посвященном анализу неструктурированных данных».

Всего в опросе приняло участие 200 руководителей ИТ-компаний. 55% респондентов рассказали, что их организациям приходится иметь дело с машинными данными: сведениями о работе приложений, серверов, гаджетов, мобильных устройств, объектов «интернета вещей», производственных датчиков. Объем неструктурированных данных в 10 раз превышает аналогичный показатель упорядоченных.

В среднем компания каждого опрошенного руководителя использует не менее семи серверов для хранения информации (NAS). У каждой третьей организации таких устройств более 10. Каждое двенадцатое предприятие имеет в своем распоряжении больше 50 NAS.

Вся ценность в данных

Большинство опрошенных предпринимателей уверены, что информация – одна из основных ценностей их бизнеса, наравне с клиентами и сотрудниками. При этом респонденты ставят ее выше бренда, интеллектуальной собственности и даже физических активов. По мнению руководителей, сведения составляют около 40% рыночной стоимости среднестатистического предприятия.

Больше всего респонденты обращают внимание на доступность информации и инструменты для ее анализа. Авторы опроса делают вывод, что это свидетельствует о необходимости повышения скорости доступа к неструктурированным данным и создания решений для их обработки. Исследователи отмечают, что сейчас на рынке достаточно устройств и программных комплексов для хранения неупорядоченных данных, но ощущается нехватка аналитических средств.

Надежды и опасения

Технический директор P1 Technologies Джефф Диниско весьма пессимистично оценивает будущее рынка обработки информации. По его мнению, без новых технологий для анализа неструктурированных нельзя сделать качественный скачок вперед. «Мы просто ничего не сможем сделать с таким массивом информации», – отметил он.

Топ-менеджер Igneous Киран Багешпар дает более оптимистичный прогноз. Он уверен, что, даже несмотря на нехватку аналитических инструментов, неупорядоченные данные находят все больше применения, их роль в развитии общества растет. В качестве примера эксперт приводит машинное обучение, которое на смогло бы существовать без изучения больших объемов информации.

Татьяна Бочарникова, глава представительства NetApp в России и странах СНГ, согласна с результатами исследования и тем фактом, что количество неупорядоченных данных растет по всему миру. Она также отметила тенденцию к оптимизации расходов компаний на ИТ-инфраструктуру, в том числе касающихся хранения информации.



Источник: https://infostart.ru/journal/news/tekhnologii/lavinoobraznyy-rost-neuporyadochennykh-dannykh-nachal-trevozhit-ekspertov_956412/
Автор:
Александр Вашкевич Аналитик


Какой объем дисковой памяти использует ваш домашний ПК?


Менее 256 ГБ (15.38%, 14 голосов)
15.38%
256-512 ГБ (19.78%, 18 голосов)
19.78%
512 – 1024 ГБ (20.88%, 19 голосов)
20.88%
1024 – 2048 ГБ (16.48%, 15 голосов)
16.48%
Более 2 ТБ (23.08%, 21 голосов)
23.08%
Нет домашнего ПК (4.4%, 4 голосов)
4.4%

Комментарии
В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
1. Senator_I 13 03.12.18 10:08 Сейчас в теме
Двух дисков по 500 Гбайт не хватает ,периодически на внешние HDD информацию переношу.
Kochergov; +1 Ответить
2. trdm 03.12.18 10:37 Сейчас в теме
Достаточно научиться отсеивать важное от второстепенного и эта проблема исчезнет.
ccserg; Senator_I; +2 Ответить
3. Senator_I 13 03.12.18 11:01 Сейчас в теме
(2) Много раз были случаи, когда удаленные данные, которые даже стопроцентно не понадобятся, через время оказывались нужными позарез! Одну программу бесплатную, к примеру, полтора дня искал в интернете первый раз, когда попытался второй раз найти, так и не нашел, благо на другом компьютере сохранилась.
Kochergov; +1 Ответить
4. Поручик 4518 03.12.18 11:16 Сейчас в теме
(3) В облако запихивайте. Учётка на яндексе или мыл.ру есть у всех, тем более денег не просят
SITR-utyos; +1 Ответить
5. Senator_I 13 03.12.18 11:28 Сейчас в теме
(4) На Яндексе уже место закончилось, там самые необходимые "под рукой" данные, на майле есть еще немного места, но ненадолго.
22. Timur.V 72 04.12.18 11:54 Сейчас в теме
(5)
Можно создать несколько ящиков. Для каждого ящика место считается отдельно.
8. fd13 03.12.18 11:52 Сейчас в теме
(4) Учеток там не держу. Пользую гугловый диск (иногда) - совместная работа над документами неплохо организована, бывает полезно. Все основное в личном облаке на Synоlogy.
10. suepifanov 03.12.18 14:58 Сейчас в теме
(3) Плюшкины в наше время гигабайты копят)
ccserg; sergathome; Stref75; +3 Ответить
11. Senator_I 13 03.12.18 15:24 Сейчас в теме
(10) а промышленность идет навстречу, благо, цена нескольких гигабайт не соизмерима с автомобилем, как раньше.
15. spectre1978 55 04.12.18 09:14 Сейчас в теме
(3) у меня тоже такие случаи были. Но как по мне, все равно это ни разу не повод собирать весь хлам. Я лучше раз в десять лет помучаюсь с тем что "надо позарез", чем буду обрастать всем этим барахлом, в котором, если уж по чесноку, все равно ничерта не найдешь...
30. Healer 1 04.12.18 16:10 Сейчас в теме
6. Senator_I 13 03.12.18 11:29 Сейчас в теме
(2) P.S. кстати, тратить свой законный выходной на разбор данных вовсе не хочется! ;-)
13. Неопределено 85 04.12.18 04:25 Сейчас в теме
(6) Так не собирайте их. Ума не приложу чем можно было забить дома терабайт дискового пространства.
16. Senator_I 13 04.12.18 09:15 Сейчас в теме
(13) Ну во-первых там не только личные данные, но и софтина всякая, фильмы опять же и т.п. И не за один год скопилось, у меня ПК в 2001 появился.
17. Неопределено 85 04.12.18 09:32 Сейчас в теме
(16) Я, конечно, отстал на 3 года, но у меня тоже есть разный софт в виде игр по 20+Гб каждая и при этом занято всего гигабайт 300, а фильмы в наше время широкополосного доступа в сеть можно посмотреть и онлайн в 1080.
18. Senator_I 13 04.12.18 10:00 Сейчас в теме
(17) Вот перекроют доступ к онлайн фильмам,тогда посмотрим кто прав. )))
19. TODD22 18 04.12.18 10:18 Сейчас в теме
(17)человек пытается интернет скачать, а то вдруг отключат.
sergathome; +1 Ответить
21. Неопределено 85 04.12.18 11:03 Сейчас в теме
(19) Чего там качать? Эту штуку скинуть на дискету и готово.
33. Senator_I 13 04.12.18 16:58 Сейчас в теме
(21) Ну вот, я себя чувствую единственным виноватым в увеличении объема цифрового мусора. Я скачал файл из интернета, теперь он мне не нужен, как мне его закачать обратно??? ;-)
23. Timur.V 72 04.12.18 12:04 Сейчас в теме
(17)
(19)
Смотрел ролик с ютуба, кажется на Кубе трудно с интернетом.
Там у ~100 человек есть доступ в интернет. Они скачивают фильмы, музыку, может ещё что-то.
Затем к каждому такому человеку приходят люди со своими HDD и закачивают себе информацию.
Т.е. даже когда официально доступа к интернету нет, нашли способ обмениваться информацией.

А в России всё хорошо с интернетом? Поисковик Яндекс отбивается частично.
26. TODD22 18 04.12.18 14:19 Сейчас в теме
(23)
Затем к каждому такому человеку приходят люди со своими HDD и закачивают себе информацию.

Я так в начале нулевых ещё ходил, когда диалап был....
А в России всё хорошо с интернетом?

Вы не в РФ или у вас какие то проблемы с интернетом?
Вроде нигде с инетом проблем нет уже давно. У нас магазины даже в самых "зашореных" ПГТ и те с нормальным интернетом.
27. Timur.V 72 04.12.18 14:28 Сейчас в теме
(26)
У меня в Москве, интернет хорошо работает только через Tor браузер и VPN.
28. TODD22 18 04.12.18 14:58 Сейчас в теме
(27)у меня то же в Москве. И без тора нормально. Разве что на nnm через впн иногда захожу.
36. Неопределено 85 05.12.18 02:39 Сейчас в теме
(23) Мы раньше тоже ходили в гости с винтом, тут ничего нового. Не знаю, как в России в целом, но вчера общались со знакомым на тему интернета и оказалось что он на Кипре платит больше 30 евро за 10Мб/с, в то время как я плачу 10 за 100. Думаю, да, с интернетом у нас всё хорошо.
34. Senator_I 13 04.12.18 17:05 Сейчас в теме
(17) Ради интереса посмотрел что где на рабочем ноутбуке, так вот, папка 1cv8 в программных файлах, 1,28 Гбайт, установочник + развернутая пустая база почти 500 Мбайт. Всего, на диске С только винда и рабочие фалы с документами, 79 Гбайт занято, прочий софт, драйвера и прочее на диске D - 94,8 Гбайт, ноутбук использую только для работы, ни единого лишнего, развлекательного и т.п. файла.
38. katenok86 246 05.12.18 15:18 Сейчас в теме
(34)У меня временных файлов 1с, которые в \AppData\Roaming за месяц на 30 Гб накапливается, котрые 1с по идее сама должна чистить) Но приходится вручную
Senator_I; +1 Ответить
7. mkalimulin 452 03.12.18 11:30 Сейчас в теме
"...несмотря на нехватку аналитических инструментов..."
это мозгов что-ли?
shard; awk; +2 Ответить
12. Darklight 27 03.12.18 17:11 Сейчас в теме
(7)Автоматизированные адаптивные интеллектуальные обладающие как бинарной так нечёткой логикой анализа средства:
1. Поиска и классификации данных (массивов данных - здесь и далее)
2. Группировки, ранжирования и сравнения
3. Перераспределения расположения согласно заданным критериям
4. Ликвидации дублирующей и устаревшей информации
5. Версионирования, архивирования (в в прямом смысле, а не просто сжатие), распределение по динамичеcкой карте востребованности
6. Прогнозирования появления будущих структур информации/изменения текущих данных, их распределения по разным критериями (включая востребованность, конфиденциальность и занимаемое место)
7. Управления конфиденциальной и приватной информацией, а так же наоборот публичными и общими данными
8. Верификации, сличения, контроля и защиты данных

P.S.
Лично я уж без таких средств тону в объёме имеющихся у меня личных данных - а это десятки терабайт накоплений на HDD и терабайты на оптических дисках! Это только дома. А на работе - рабочие данные занимают ещё больше!
9. VmvLer 03.12.18 14:00 Сейчас в теме
необходимо разрабатывать и внедрять простые технологии самоуничтожения (self-destruction), т.е. каждый файл должен:
1. кроме системных свойств (дата создания, размер..) иметь свойство "период жизни".
2. задача администраторов принудительно задавать "период жизни" для типов файлов компании

аналитические данные и инструменты быстро устаревают. Пользователи просто забывают удалить хлам,
а сервера и дата-центры тонут в кучах г.

таким образом, спасение цивилизации заключается в том, что данные должны потерять особенность быть вечными
SKravchenko; Darklight; +2 Ответить
24. _wlad_ 04.12.18 13:54 Сейчас в теме
(9) Поджигатели Александрийской библиотеки такую сложную идеологию не придумывали, но результат похожий.
Senator_I; +1 Ответить
14. spectre1978 55 04.12.18 09:10 Сейчас в теме
А по-моему, неструктурированная информация - это по сути мусор, и большой вопрос, есть ли смысл ее вообще накапливать. Видимо, я не в тренде...
20. TODD22 18 04.12.18 10:39 Сейчас в теме
(14)
А по-моему, неструктурированная информация - это по сути мусор
для кого то мусор. А для кого то полезные для анализа данные.
25. _wlad_ 04.12.18 13:59 Сейчас в теме
(14) Вы предлагаете если в квартире вдруг бардак, то надо не наводить порядок, а просто всё вынести на помойку, сесть на полу и медитировать в пустой комнате как Будда ?

Но вы этого не знаете - мусор или нет, ведь она неструктурирована.
29. spectre1978 55 04.12.18 15:02 Сейчас в теме
(25) Нет, я предлагаю не накапливать мусор в процессе. Это довольно просто. Нужно просто класть на место то, что берете, и вовремя выносить ведро. Применительно к информации - это вопрос информационной культуры производителей и потребителей информации. К сожалению, с этим есть проблемы.
31. Healer 1 04.12.18 16:10 Сейчас в теме
Вообще на руборде есть практически всё.
32. sergathome 04.12.18 16:16 Сейчас в теме
Напомнило анекдот про гондурас.
35. ccserg 49 04.12.18 17:24 Сейчас в теме
накачают все подряд из сети , и потом места не хватает , это мусор а не данные )))
90 % этих данных никогда не понадобятся
37. vipetrov2 05.12.18 07:52 Сейчас в теме
Эта проблема существует уже давно, а решений нет. Анализировать не структурированные данные можно с помощью ИИ, но в этом направление развитие идет слабо. Зато всякую бребятину с помощью ИИ делают, а что надо запинывают в долгий угол. В этом плане интересно, правительства хотят следить за интернетом и записывают все подрят, а анализировать эти данные возможности нет. Там спецслужбы в ручном режиме по необходимости выдергивают информацию об одном человеке. Так что свободе в интернете ничего не угрожает.
Оставьте свое сообщение

См. также

Intel признает, что отстает от конкурентов на четыре года и будет выпускать чипы для Qualcomm

Новость ИТ-новость Микроэлектроника Новости компаний

26 июня представители корпорации Intel заявили, что компания начнет производство чипов Qualcomm. Также компания подготовила план развития, чтобы догнать своих конкурентов, таких как Taiwan Semiconductor Manufacturing и Samsung Electronics, к 2025 году.

вчера в 14:36    626    SKravchenko    0       

Представлено водяное охлаждение для чипов мощностью 2,6 кВт

Новость ИТ-новость Микроэлектроника

Компания TSMC, один из крупнейших производителей микропроцессоров, разработала инновационную систему водяного охлаждения. Она позволяет отвести от чипа 2,6 кВт тепла.

вчера в 13:19    1095    user1015646    1       

«Сбер» впервые в России получил патент на программу, написанную ИИ

Новость Искусственный интеллект ИТ-новость

Подразделение Sber AI зарегистрировало в Роспатенте приложение, написанное предварительно обученной нейросетью. Искусственный интеллект сгенерировал код на C++ и Java.

вчера в 12:18    547    VKuser24342747    1       

Линус Торвальдс добавит в Linux драйвер для NTFS от российских разработчиков

Новость Linux ИТ-новость

Создатель Linux заявил о готовности добавить драйвер в ядро операционной системы, если программисты из России займутся его интеграцией и сопровождением. Торвальдс лично примет этот pull-запрос.

28.07.2021    1870    VKuser24342747    0       

Amazon представил игровой движок с открытым исходным кодом

Новость ИТ-новость Новости компаний

Компания Amazon всерьез намерена покорить все цифровые рынки – в том числе индустрию гейминга. Разработчики выпустили движок Open 3D Engine для создания игр и других приложений с открытым исходным кодом.

28.07.2021    744    user1015646    0       

Microsoft представила эмулятор Altair 8800 на Azure Sphere

Новость ИТ-новость Микроэлектроника

Microsoft представила эмулятор ретрокомпьютера Altair 8800 на операционной системе для работы с облаком Azure Sphere.

27.07.2021    1578    SKravchenko    0       

Microsoft выпустит облачную ОС

Новость ОС ИТ-новость Облачные технологии

Компания Microsoft активно конкурирует с Amazon и Google на рынке передовых облачных технологий. Чтобы предоставить пользователям возможность гибридной работы в Windows с любого устройства, разработчики анонсировали облачную ОС – сервис Windows 365.

26.07.2021    1719    user1015646    0       

Google добавит в Chrome режим приоритетной загрузки сайта по HTTPS

Новость Безопасность Интернет ИТ-новость

В новой версии Google Chrome появится режим HTTPS-First, который заставит браузер всегда пытаться загружать сайты по защищенному протоколу. В будущих релизах веб-обозревателя эта функция будет включена по умолчанию.

21.07.2021    1165    VKuser24342747    0       

JetBrains назвала JavaScript и SQL самыми популярными языками в России

Новость Аналитика ИТ-новость Языки программирования

Компания JetBrains провела ежегодный опрос об экосистеме разработки в 2021 году. В нем приняли участие 31 743 разработчика из 183 стран, в том числе из Российской Федерации и СНГ.

21.07.2021    1371    VKuser24342747    3       

MongoDB с последней версией Atlas стал бессерверным

Новость СУБД ИТ-новость

13 июля MongoDB представила версию 5.0 платформы баз данных NoSQL. Последние обновления поддерживают многие рабочие нагрузки в бессерверном режиме. Новая версия включает новые возможности для приложений и улучшения конфиденциальности и безопасности.

20.07.2021    1656    SKravchenko    1       

«Яндекс» представил уникальный сервис для автоматического перевода видео

Новость Искусственный интеллект ИТ-новость Новости компаний Яндекс

«Яндекс» разработал прототип сервиса на базе нейросети, который в режиме реального времени переводит иностранные ролики на русский язык и озвучивает их. По словам компании, технология не имеет аналогов в мире.

20.07.2021    1518    VKuser24342747    2       

Появился способ игнорировать запрет установки Windows 11 на слабые ПК

Новость Windows ИТ-новость

Новая Windows 11 не может быть установлена на компьютеры, которые не соответствуют системным требованиям, определенным разработчиками. Однако продвинутые пользователи нашли способ обойти это ограничение.

19.07.2021    1419    VKuser24342747    0       

На свежих процессорах Intel создали микрокомпьютер под Windows 10

Новость Windows Гаджеты ИТ-новость Микроэлектроника

Энтузиасты и стартаперы полюбили Arduino и Raspberry Pi. Но инженеры Commate Computer (Commell) пошли дальше и представили миниатюрный ПК LE-37O на базе новейших чипов Intel Tiger Lake. И на нем можно запустить Windows 10.

16.07.2021    1345    user1015646    3       

Вот это поворот: Microsoft выпустила дистрибутив Linux

Новость Linux ИТ-новость Новости компаний

Пока мир замер в ожидании новой Windows 11, Microsoft решила преподнести пользователям большой сюрприз – и представила собственный дистрибутив Linux, CBL-Mariner 1.0.

15.07.2021    1684    user1015646    2       

Стартовала программа возмещения затрат разработчикам на скидки для малого бизнеса

Новость Законодательство Импортозамещение ИТ-новость Облачные технологии

Утверждена программа, в которой предусмотрено субсидирование разработки облачного программного обеспечения для малого и среднего бизнеса, а также скидки на софт, разработанный в рамках данной программы, до 50%.

15.07.2021    807    ЕленаЧерепнева    0       

Исследователи установили: ИИ-программы для собеседований не понимают речь соискателя

Новость Искусственный интеллект ИТ-новость

Эксперты из Массачусетского технологического института (MIT) изучили приложения, анализирующие резюме кандидатов. Ученые пришли к выводу, что такой софт плохо справляется с задачами и дает неверные результаты.

14.07.2021    727    VKuser24342747    1       

Юбилейный индекс TIOBE на июль. Рейтинг отмечает 20-летие

Новость ИТ-новость Рейтинг Языки программирования

Ежемесячный индекс TIOBE показывает, какие языки программирования наиболее популярны, и как их популярность растет с течением времени. В июле TIOBE отмечает 20-летие, публикует новый рейтинг и график популярности языков программирования за 20 лет.

12.07.2021    1200    SKravchenko    0       

Google сделает обязательной двухэтапную аутентификацию для аккаунтов разработчиков

Новость Google ИТ-новость Мобильные приложения

До конца года всем разработчикам мобильных приложений для продуктов Google нужно подключить двухэтапную аутентификацию. Также им придется пройти дополнительную верификацию личности. 

08.07.2021    1082    VKuser24342747    1       

Google установил новый обязательный формат для Android-приложений

Новость Google ИТ-новость Мобильные приложения Новости компаний

Компания Google объявила, что стандарт приложений Android App Bundle (AAB) станет обязательным в Play Store. Он заменит монолитный формат APK.

07.07.2021    1699    user1015646    0       

Токен исходного кода интернета продали с аукциона

Новость ИТ-новость

NFT-токены – уникальные двойники цифровых произведений – становятся все популярнее: их стали предлагать на традиционных аукционах с вековой историей. На этот раз ушел с молотка токен исходного кода интернета – на Sotheby’s его продали за 5,43 млн долларов США.

06.07.2021    2388    user1015646    0       

Российский разработчик научил нейросеть генерировать голос Геральта из The Witcher 3

Новость Видеоигры Искусственный интеллект ИТ-новость

Программист под ником nikich340 создал модификацию A Night to Remember для игры The Witcher 3: Wild Hunt, в которую добавлены новые реплики главного героя, озвученные нейросетью. 

06.07.2021    1593    VKuser24342747    0       

Linux получил крупнейшее обновление с момента выпуска пятой версии

Новость Linux ИТ-новость

Представлен первый стабильный релиз ядра Linux 5.13. По словам Линуса Торвальдса, это один из самых значительных релизов 5.x. ОС получила возможность корректно работать на процессорах Apple M1 и Intel Alder Lake.

05.07.2021    1703    VKuser24342747    4       

Amazon запустил конкурс на поиск уязвимостей AWS BugBust

Новость Безопасность ИТ-новость

Компания Amazon объявила о новом челлендже по поиску уязвимостей в AWS. И это не традиционная баунти-программа: здесь куда больше геймификации и амбициозная цель – совместно избавиться от 1 миллиона багов.

05.07.2021    1709    user1015646    0       

ИИ-помощник для программистов от Microsoft сможет дописывать код

Новость Искусственный интеллект ИТ-новость

Microsoft и GitHub представили совместный проект Copilot («второй пилот») на базе технологий организации OpenAI. Ассистент способен анализировать код и предлагать варианты завершения строк в зависимости от контекста. 

05.07.2021    1955    VKuser24342747    2       

В России начнет работу единая статистическая платформа

Новость Аналитика ИТ-новость

Правительство согласовало положение, которое предусматривает создание к 2022 году сервиса для объединения всех государственных ресурсов статистики. Новая разработка также унифицирует принципы работы с данными. 

02.07.2021    1195    VKuser24342747    0