Новости сегодня на DirectAdvert

Новости сегодня от Adwile

Качество данных становится критически важным

Технический директор Syncsort размышляет об инфраструктуре данных и о проблемах, порожденных новыми технологиями и цифровыми преобразованиями.
Качество данных становится ключевым фактором, определяющим, насколько успешными окажутся усилия предприятия по монетизации своих информационных активов, уверены участники Саммита по современному управлению данными, организованного компанией Syncsort — поставщиком решений, позволяющих обеспечить доступность больших данных для самых актуальных видов аналитической обработки. Выступившая на саммите доктор Тендю Йогуртчу, технический директор Syncsort,  отметила, что для достижения  высокого качества  данных  предприятиям нужно очень тщательно продумывать инфраструктуру данных и последовательно выстраивать процессы управления ими. Это поможет избежать множества проблем, которые, как известно, стремительно нарастают по мере увеличения объемов, потоков, скорости обработки, разнообразия форматов и источников данных.

- Сегодня в России многие инициативы в области управления данными сконцентрированы на их монетизации и получении выгоды для бизнеса. Как добиться успеха в этом направлении?

Все зависит от конкретной задачи и поставленных целей.  Необходимо  правильно определить источники данных и оценить, какие технологии понадобятся для обработки полученной информации. Ключевой фактор успеха — заблаговременный выбор подходящих метрик. Очень часто  компании задумываются  о качестве данных уже после завершения проектов,  но,  чтобы внести  необходимые изменения  на этой  стадии,  требуются серьезные затраты. Поэтому важно заранее определить, как будет осуществляться управление данными, где и как будут создаваться и обрабатываться данные, которым можно доверять, и затем выбрать технологии, способные обеспечить нужную гибкость и переход на перспективные платформы.

- Российские заказчики продолжают спорить, надо ли сохранять все данные или только те, ценность которых для бизнеса понятна уже сегодня. Каковы ваши рекомендации?

Считаю, что необходим компромисс. Всегда пригодятся прежние, «исторические» данные — например, для обучения создаваемых моделей и прогнозирования. Полноценный анализ данных реального времени с извлечением из них пользы тоже предполагает наличие больших объемов ранее накопленной информации. Поэтому следует искать возможности для снижения стоимости хранения как «исторических» данных, так и тех сведений, которые  необходимо хранить по требованиям  регуляторов. Сегодня можно организовать «холодное» хранение в облаке, переместив туда редко используемые данные, или задействовать различные инфраструктурные ресурсы.

- Менеджеры всегда хотят иметь достоверную актуальную информацию. Как обеспечить  и измерить ( что тоже очень  важно ) точность корпоративных данных?

Качество данных имеет первостепенное значение, и его обеспечение становится серьезной проблемой, поскольку источников данных сейчас гораздо больше, чем когда-либо. По мере того как предприятия все чаще используют для хранения новые решения, например блокчейн и облака, в ходе репликации неточные данные продвигаются все дальше и дальше, и зачастую  становится  трудно определить, на каком этапе они стали некорректными. В частности, блокчейн позволяет хранить информацию, которая никогда не может быть потеряна, изменена или удалена, но эта технология не способна выявлять поступающие на вход «плохие» данные. Поэтому крайне необходим контроль качества данных, поступающих в блокчейн.

Серьезным шагом к измерению качества данных станет возможность профилировать все ваши  данные. Это  позволит сразу же выявлять отклонения,  определять  процентное соотношение  несущественной информации  и  выполнять многие другие действия.  Кроме того, профилирование поможет определять бизнес-правила и оценивать, какая часть данных им соответствует.

Чтобы создать среду, способствующую получению точных данных, предприятиям следует сконцентрироваться на бизнес-проблемах, которые они пытаются решить. Конечно, многое зависит от применения правильных инструментов, но не менее важно, чтобы сотрудники, работающие с данными, понимали их суть и имели в своем распоряжении средства, которые позволяют  обнаруживать  любые отклонения от установленных регуляторами норм,  а также выявлять  персональные  данные и  данные платежных карт (PCI), не дожидаясь их перемещения на следующие этапы обработки и хранения.

Едва ли сотрудники смогут вручную отслеживать и оценивать  всю поступающую информацию  — у них попросту нет для этого времени. Зато компьютерная программа сможет быстро сканировать огромные объемы данных. Но алгоритмы машинного обучения окажутся неэффективными, если ими не будут пользоваться те специалисты, которые хорошо  разбираются в бизнес-проблемах  и  процессах  и знают, какие данные требуются и какие доступны для решения этих проблем. Алгоритмы ML могут генерировать оповещения в двух ситуациях: если возникает проблема, связанная с качеством данных,  и  если имеющиеся модели не могут прийти к какому-либо заключению. В последнем случае модели нужно переобучить или доработать. Следовательно, приоритетом ИТ-руководителя должно стать формирование компании, в которой грамотно работают с данными.

- Какие способы оптимизации инфраструктуры данных вы считаете наиболее эффективными?

Принцип номер один: принимая решение о хранении данных на платформе конкретного поставщика, вы должны продумать, как избежать его блокировки. Сегодня на рынке предлагаются как традиционные платформы (Teradata, Netezza, Oracle и пр.), так и облачные. Более того, организации могут хранить в облаке все свои данные, достаточно лишь выбрать инструменты, которые позволят управлять размещением  информации  и доступом к  ней  на нескольких облачных платформах. Некоторые крупные европейские банки используют сервисы трех облачных поставщиков. Если есть возможность задействовать  нескольких  провайдеров, надо ею воспользоваться, хотя это не всегда удается. В любом случае в составе инфраструктуры нужно иметь платформы для работы с критически важными данными. Крайне важно, чтобы эти платформы справлялись с сезонными и другими колебаниями транзакционной нагрузки.

- Многие клиенты пытаются обрабатывать и анализировать потоки данных. Нужно ли им кардинально менять свою ИТ-инфраструктуру? И есть ли способы обновления ИТ-инфраструктуры без «глобальных» изменений?

На этот вопрос нет однозначного ответа, поскольку надо понимать, что собой представляет ИТ-инфраструктура организации и какие бизнес-цели  стоят  перед сотрудниками. Так, предприятия, желающие создать озеро данных, чтобы объединить несколько разрозненных активов данных в масштабируемом репозитории для их  последующего  анализа, обычно настаивают на «глобальных» изменениях в инфраструктуре, но иногда можно выполнить «легкое»  обновление —  например, оптимизировав существующую облачную инфраструктуру. Кроме того, многие  организации  стремятся создавать потоковые каналы и обеспечивать обмен данными приложений внутри собственной сети, чтобы анализировать их в режиме реального времени.  Наша компания помогает  своим клиентам найти правильное решение для получения большей выгоды от имеющихся у них данных с опорой на уже сделанные  инвестиции. Мы  выстраиваем наши продукты семейства Syncsort Connect так, чтобы упростить интеграцию новых технологий в уже существующую ИТ-инфраструктуру, предоставляя возможности для создания потоковых каналов и более полного использования потенциала корпоративных данных.

- Количество источников данных, похоже, будет расти, и в ходе их интеграции наверняка возникнет проблема увеличения вариативности данных и, как следствие, усложнения систем. Что можно  сделать  с  этим? 

Мы уже видим, как предприятия буквально тонут в данных, поскольку число их источников за последние годы резко выросло, к тому же появились потоки и озера данных. Некоторые организации взяли стратегический курс на облака как приоритетные вычислительные среды, а другие твердо намерены хранить конфиденциальные данные внутри компании. Есть те, кто выбирает стратегию гибридного облака или использует облачные среды для архивных данных, чтобы предоставить их по первому требованию регуляторов.

Лучший способ подготовиться к росту числа  источников —  сосредоточиться на обеспечении качества данных до их отправки в облако, блокчейн и другие ресурсы для размещения, а также  убедиться в том,  что имеющиеся у вас системы очистки, обогащения и преобразования данных способны в достаточной степени масштабироваться.

- Какие проблемы станут наиболее важными с точки зрения управления данными в обозримом будущем?

Как уже  было сказано,  все большее значение придается качеству  данных. Необходимо гарантировать достаточно высокое качество  и  всей той информации,  что хранится на множестве унаследованных платформ, размещается на новых и используется для анализа в реальном  времени.  Кроме того, нужно обратить внимание на выполнение требований в отношении корпоративного управления  данными  и на  работу с метаданными, а также исключить  дублирование  информации. 

Еще одна проблема состоит в том, что ИТ-руководителям приходится решать сложнейшую задачу:  они должны  создать корпоративную инфраструктуру, которая, с одной стороны, способна противостоять серьезным угрозам, обеспечивая сохранность и безопасность критически важной информации, а с  другой —  демонстрировать высокую доступность данных и предоставлять широкие возможности для бизнес-аналитики. Многие организации инвестируют немалые средства в защиту от вирусов и вредоносных программ, управление обновлениями и исправлениями, обнаружение и предотвращение вторжений, а также в обучение сотрудников. Большое влияние на проекты в области управления данными окажут Общий регламент по защите персональных данных (GDPR), принятый ЕС в прошлом году, и Калифорнийский закон о конфиденциальности данных потребителей (CCPA), вступающий в силу в январе 2020 года. В связи с этим еще  большее  значение приобретают инструменты, способные сканировать данные с целью выявления в них конфиденциальной информации.

Читайте на 123ru.net

Другие проекты от 123ru.net



Архангельск

В Архангельской области спрос на хирургов вырос в два раза



Жизнь

Ритуальные убийствa и оккультные корни бакинского неонацизма




Українські новини

Як обрати дверну ручку для дому: Поради та рекомендації



Новости 24 часа

ИНСТРУКТАЖ ПО БЕЗОПАСНОСТИ



Game News

Авторы Warhammer 40,000: Space Marine 2 противопоставляют себя современной западной индустрии



Москва

Мишустин призвал развивать отечественную микроэлектронику на фоне санкций



News Every Day

Russia to finance encyclopedia of Islam



Происшествия

В Назрани женщину обманули при поиске работы в IT-сфере



Москва

Экономика: Россияне резко перестали покупать новые квартиры



Сергей Брановицкий

Песня под Ключ. Купить Песню под Ключ. Запись Песни под Ключ.



Москва

Нижегородцев приглашают к участию в конкурсах «IT-Планета Профессионалы» и «Активное IT-образование»



WTA

Касаткина вышла в 1/4 финала турнира WTA в Сеуле



Москва

Центр восточной медицины в Петербурге



SpaceX

Cards Against Humanity sues Elon Musk for $15M, alleges that SpaceX invaded a plot of land it owns in Texas: 'Go **** yourself, Elon Musk'



Симферополь

Урок безопасности «Огонь ошибок не прощает».



Москва

Более 14 тысяч жителей СВАО получили новые квартиры по реновации - Собянин



Москва

Собянин: Началась реставрация фасадов и кровли здания биржи на Ильинке



Москва

Центр восточной медицины в Петербурге



103news.com — быстрее, чем Я..., самые свежие и актуальные новости Вашего города — каждый день, каждый час с ежеминутным обновлением! Мгновенная публикация на языке оригинала, без модерации и без купюр в разделе Пользователи сайта 103news.com.

Как добавить свои новости в наши трансляции? Очень просто. Достаточно отправить заявку на наш электронный адрес mail@29ru.net с указанием адреса Вашей ленты новостей в формате RSS или подать заявку на включение Вашего сайта в наш каталог через форму. После модерации заявки в течении 24 часов Ваша лента новостей начнёт транслироваться в разделе Вашего города. Все новости в нашей ленте новостей отсортированы поминутно по времени публикации, которое указано напротив каждой новости справа также как и прямая ссылка на источник информации. Если у Вас есть интересные фото Вашего города или других населённых пунктов Вашего региона мы также готовы опубликовать их в разделе Вашего города в нашем каталоге региональных сайтов, который на сегодняшний день является самым большим региональным ресурсом, охватывающим все города не только России и Украины, но ещё и Белоруссии и Абхазии. Прислать фото можно здесь. Оперативно разместить свою новость в Вашем городе можно самостоятельно через форму.

Другие популярные новости дня сегодня


Новости 24/7 Все города России





Топ 10 новостей последнего часа




Новости России

Центр восточной медицины в Петербурге

Два корпуса для участников реновации ввели в эксплуатацию в московском Крюкове

Центр восточной медицины в Петербурге

Учителя в ужасе, а дети радостно потирают руки: озвучен обновленный график каникул 2024/2025


Москва

Центр восточной медицины в Петербурге






Rss.plus

ИНСТРУКТАЖ ПО БЕЗОПАСНОСТИ

В Подмосковье сотрудники Росгвардии провели встречу со студентами финансового университета

В Подмосковье сотрудники Росгвардии провели встречу со студентами финансового университета

Родители 317,2 тыс. детей в Московской области получают единое пособие

Moscow.media
Москва

Собянин рассказал о проектах финалистов московских технологических конкурсов



103news.comмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "103 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. 103news.com — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

103news.com — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.

Музыкальные новости

Елена Волкова

В Республике Таджикистан стартует проект «Русский язык: читаем, слушаем, смотрим в странах СНГ»




Спорт в России и мире

Алексей Смирнов – актер, которого, надеюсь, еще не забыли

«Спартак» — «Динамо» Москва — 2:2. Видеообзор матча РПЛ

У экс-супруги Матвея Сафина изъяли "Мерседес"

Две медали привезли псковички с чемпионата России по пилонному спорту


WTA

Теннисистка Касаткина прошла в полуфинал турнира WTA в Сеуле



Новости Крыма на Sevpoisk.ru


Москва

Безопасность футбольного матча обеспечила Росгвардия в Москве



Частные объявления в Вашем городе, в Вашем регионе и в России