Содержание
- Подстановка констант — это один из методов …
- Комплекс методов и алгоритмов, применяемых в аналитическом приложении с целью подготовки данных к решению конкретной аналитической задачи и приведения их в соответствие с требованиями, определяемыми спецификой задачи и способами ее решения:
- Средствам (инструментам) предобработки данных:
- Противоречиями называют две или более записи таблицы, если они содержат одинаковые наборы значений …
- Процедура фильтрации может потребоваться в следующих случаях:
- Значения, которые сильно отличаются от окружающих данных или несовместимы с ними:
- Основные критерии оптимальности данных с точки зрения консолидации данных:
- Процесс дополнения данных некоторой информацией, которая позволит повысить эффективность решения аналитических задач:
- Аномалии, которые отражают факты и события, имевшие место в действительности, но вызванные исключительными обстоятельствами, которые имеют место очень редко или в единичных случаях называют …
- Основные задачи, которые решаются в процессе консолидации данных:
- Удаление записи с аномальным значением целесообразно проводить …
- Дубликатами называют две или более записи таблицы, если они содержат одинаковые наборы значений …
- Комплекс методов и процедур, направленных на устранение причин, мешающих корректной обработке: аномалий, пропусков, дубликатов, противоречий, шумов и т.п.:
- Интерполяция данных — это один из методов …
- Комплекс методов и процедур, направленных на извлечение данных из различных источников, обеспечение необходимого уровня их информативности и качества, преобразование к единому формату, в котором они могут быть загружены в хранилище данных или аналитическую систему:
- Возможны ситуации, при которых поиск дубликатов и противоречий проводить не целесообразно:
Подстановка констант — это один из методов …
- корректировки аномалий
- исключения дубликатов
- исключения противоречий
- восстановления пропущенных значений
Комплекс методов и алгоритмов, применяемых в аналитическом приложении с целью подготовки данных к решению конкретной аналитической задачи и приведения их в соответствие с требованиями, определяемыми спецификой задачи и способами ее решения:
- очистка
- предобработка
- трансформация
- консолидация
Средствам (инструментам) предобработки данных:
- Очистка от шумов и сглаживание рядов данных
- Регрессионный анализ
- Восстановление пропущенных значений
- Нейронные сети
- Редактирование аномальных значений
- Карты Кохонена
- Обработка дубликатов и противоречий
- Фильтрация
- Факторный анализ
Противоречиями называют две или более записи таблицы, если они содержат одинаковые наборы значений …
- всех признаков
- входных признаков и различные наборы значений выходных
- выходных признаков и различные наборы значений входных
Процедура фильтрации может потребоваться в следующих случаях:
- значения, содержащиеся в записи, могут негативно повлиять на результаты анализа
- значения записи нежелательны для использования в данной аналитической задаче
- запись связана с каким-либо объектом или событием, которое не желательно рассматривать при анализе
- запись содержит незначащую информацию и т.д.
- все вышеперечисленное
Значения, которые сильно отличаются от окружающих данных или несовместимы с ними:
- аномалии
- отклонения
- противоречия
- искажения
Основные критерии оптимальности данных с точки зрения консолидации данных:
- обеспечение высокой скорости доступа к ним
- компактность хранения
- автоматическая поддержка целостности структуры данных
- контроль непротиворечивости данных
- адекватность данных поставленной задаче
- структурированность данных
Процесс дополнения данных некоторой информацией, которая позволит повысить эффективность решения аналитических задач:
- очистка
- трансформация
- визуализация
- обогащение
Аномалии, которые отражают факты и события, имевшие место в действительности, но вызванные исключительными обстоятельствами, которые имеют место очень редко или в единичных случаях называют …
- естественными
- искусственными
- фактическими
- теоретическими
Основные задачи, которые решаются в процессе консолидации данных:
- выбор источников данных
- разработка стратегии консолидации
- оценка качества данных
- обогащение
- очистка
- анализ
- прогнозирование
- синтез
Удаление записи с аномальным значением целесообразно проводить …
- всегда
- если число записей в выборке данных существенно превышает минимум, требуемый для анализа
- если количество аномальных значений невелико
- никогда
Дубликатами называют две или более записи таблицы, если они содержат одинаковые наборы значений …
- всех признаков
- входных признаков и различные наборы значений выходных
- выходных признаков и различные наборы значений входных.
Комплекс методов и процедур, направленных на устранение причин, мешающих корректной обработке: аномалий, пропусков, дубликатов, противоречий, шумов и т.п.:
- очистка
- трансформация
- визуализация
- обогащение
Интерполяция данных — это один из методов …
- корректировки аномалий
- исключения дубликатов
- исключения противоречий
- восстановления пропущенных значений
Комплекс методов и процедур, направленных на извлечение данных из различных источников, обеспечение необходимого уровня их информативности и качества, преобразование к единому формату, в котором они могут быть загружены в хранилище данных или аналитическую систему:
- консолидация
- агрегирование
- обобщение
- фильтрация
Возможны ситуации, при которых поиск дубликатов и противоречий проводить не целесообразно:
- да
- нет