Учеба  ->  Науки  | Автор: | Добавлено: 2015-03-23

Статистика - дизайн информации

Мы живем в веке информационных технологий, а значит, повсюду нас окружает информация. Объемы её очень велики, поэтому люди стремятся систематизировать, преобразовать данные, представляя их в максимально удобном виде – то есть они занимаются дизайном информации. Дизайн (от англ. design - проектировать, конструировать) – художественное конструирование предметов, проектирование эстетического облика. Дизайн широко применяется во многих областях: моделирование одежды, декор интерьера, архитектурное строительство, создание web-сайтов и многое другое. То есть мы можем говорить о дизайне, как неотъемлемой составляющей любого предмета – всякая вещь имеет внешний облик, различный в зависимости от функциональных особенностей. Этот термин применим не только к материальным объектам, но и к абстрактным понятиям – например, к информации. Мы не можем потрогать информацию, но можем преобразовать её, проделывая над ней различные операции. Дизайном информации занимается наука статистика. Одна из основных задач статистики состоит в надлежащей обработке информации. Конечно, у этой науке есть много других задач: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т. д. Ни одна из этих целей недостижима без обработки данных. Поэтому, первое, чем стоит заняться – это статистическими методами обработки информации. Для этого необходимо знать термины, принятые в статистике.

Новый термин Простое описание Более научный термин Определение

Общий ряд данных То, откуда выбирают Генеральная совокупность Множество всех в принципе возможных результатов измерения

Выборка То, что выбрали Статистическая выборка, Множество результатов, реально статистический ряд полученных в данном измерении

Варианта Значение одного из результатов Варианта Одно из значений элементов выборки измерения

Ряд данных Значение всех результатов измерения, Вариационный ряд Упорядоченное множество всех вариант перечисленные по порядку

Рассмотрим примеры. Допустим, вы записываете номера месяцев рождения своих одноклассников. В таком случае общий ряд данных – это числа от 1 до 12, варианты – это номера месяцев рождения конкретных учеников именно вашего класса, а ряд данных – это все варианты, перечисленные по порядку. В одном классе ряд данных – это 3, 4, 5, 7. 8, 11. В другом классе может получиться другой ряд данных. Например, 1, 2, 5. 6, 8, 9, 11, 12 и т. д.

Итак, фундамент заложен. Теперь можно приступать к решению конкретных задач по дизайну информации.

Пример. В 11ом классе ученики показали следующие результаты письменного экзамена по математике:

6, 7, 7, 8, 9, 2, 10, 6, 5, 6

7, 3, 7, 9, 9, 2, 3, 2, 6, 6

6, 7, 8, 8, 2, 6, 7, 9, 7, 5

9, 8, 2, 6, 6. 3, 7, 7, 6, 6

Как мы видим такая информация «трудно» читается. Она не наглядна и занимает много места. Наша цель – каким то образом преобразовать начальные данные, получить сравнительно небольшое количество характеристик начальной информации и в дальнейшем оперировать именно с этими, как правило, численными характеристиками.

Решение. Дана выборка с объёмом (количеством всех полученных результатов) 40. Её ряд данных – 2, 3, 5, 6, 7, 8, 9, 10.

ТАБЛИЧНОЕ ПРЕДСТАВЛЕНИЕ

Составим таблицу из двух строк, в первой из которых будет ряд данных. Каждая варианта из этого ряда какое-то количество раз реально наблюдалась в выборке. Это количество называют кратностью варианты. Вот и поставим во вторую строку кратности соответствующих вариант. Так, например, оценка в 2 балла встретилась 5 раз. Значит, кратность варианты 2 равна 5. Сделав то же самое для других оценок, найдём их кратности. Они равны 5; 3; 2; 11; 9; 4; 5; 1. Можно всегда себя проконтролировать, вычислив сумму кратностей всех рассмотренных вариант: 5+3+2+11+9+4+5+1=40. Сумма кратностей всегда равна объёму выборки, т. е. количеству всех произведённых при выборке измерений.

Мы получим таблицу распределения выборки:

Варианта 2 3 5

Для каждого участка сложим кратности вариант, попавших в него. Получим кратности каждого участка.

Варианта "Плохая" "Средняя" "Хорошая"

Кратность варианты8 22 10

Теперь нарисуем три прямоугольника. Основание первого – это отрезок [2; 4], его площадь равна 8, т. е. равна кратности «плохой» варианты. Аналогично поступим с двумя другими вариантами. Получим столбчатую диаграмму, или гистограмму распределения.

Гистограмма распределения кратностей

Поделив высоты столбиков на объём всей выборки, получим другую столбчатую диаграмму – гистограмму распределения частот.

Гистограмма распределения частот

Как обычно, таблицу можно дополнить и третьей строкой, в которой частоты вариант выражены в процентах.

Варианта "Плохая" "Средняя" "Хорошая"

Кратность варианты 8 22 10

Частота варианты 0,2 0,55 0,25

Частота (%) варианты 20 55 25

Ниже приведена гистограмма распределения частот в процентах.

Гистограмма распределения частот (%)

С одной стороны, в гистограмме потеряна первоначальная точная информация: мы не знаем, например, сколько именно человек получили 6 баллов. С другой стороны, ответ получается более быстро, и наглядна видна качественная оценка распределения данных. Примерно половина абитуриентов получила «средние» баллы, а «плохиши» и «хорошисты с отличниками» поделились почти поровну. Для отчетов по результатам экзаменов такой вид исходной информации – в самый раз.

ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ, ИЛИ «ПАСПОРТ» ВЫБОРКИ

Таким образом, мы многое узнали о нашей выборке, преобразовали исходную информацию в удобный, красивый вид – словом, преобразили её. У выборки появилось лицо, так не пора ли нам выдать ей паспорт? Точно так же как у каждого человека есть паспорт, где записаны важные сведения, так и у каждой выборки есть своего рода «паспортные данные», которые весьма существенны. Следует только понимать, что они в принципе не могут дать полной информации о выборке: абсолютно полной информацией о выборке является сама выборка. Но так как объёмы выборок данных, как правило, очень велики, то приходится иметь дело с некоторым набором важных числовых характеристик этих выборок. Итак, перейдём к составлению «паспорта» выборки. Нам поможет переход от выборок к полигонам частот выборок. Каждый полигон частот – это график некоторой функции. Этот график является ломаной из конечного числа звеньев. Вершины ломаной соответствуют вариантам и их частотам.

Размах выборки – это разница между наибольшей и наименьшей вариантой. На графике – это длина области определения полигона частот. Мода выборки – это наиболее часто встречающаяся её варианта. На графике – это точка, в которой достигается максимум полигона частот. Если эта точка одна или если таких точек несколько, но подряд идущих, то выборку называют унимодальной (одна мода). Возможны и бимодальные (две моды) выборки и т. д.

Наиболее важной характеристикой выборки является её среднее значение.

Общее правило сформулируем так:

Есть и другой способ:

Среднее значение выборки не имеет наглядной иллюстрации в полигоне частот. Оно, по определению, усредняет все различные результаты, заменяя полную, объёмную информацию одним единственным числом. Зато среднее значение выборки имеет наглядный физический смысл. На оси абсцисс отметим n точек, координаты которых равны вариантам выборки. В первую точку поместим массу, равную частоте первой варианты. Во вторую точку поместим массу, равную частоте второй варианты и т. д. Получится система из n материальных точек. Общий вес этой системы равен 1. Так вот её центр тяжести в точности совпадает со средним значением выборки.

Найдём размах, моду и среднее значение нашей выборки (для этого удобно использовать полигон частот).

Размах = 10 – 2 = 8; мода = 6.

Среднее значение = (2*5+3*3+5*2+6*11+7*9+8*4+9*5+10*1)/40 = =10+9+10+66+63+32+45+10)/40 = 245/40 = 6,125. Занесём эти данные в паспорт.

ПАСПОРТ

Размах выборки – 8;

Мода выборки – 6;

Среднее значение – 6,125

ЭКСПЕРИМЕНТАЛЬНЫЕ ДАННЫЕ И ВЕРОЯТНОСТИ СОБЫТИЙ

Рассмотрим связь между вероятностями случайных событий и экспериментальными статистическими данными. Сделаем это на примере бросания монеты. Будем последовательно, через запятую писать О и Р в зависимости от того, выпал «орёл» или «решка». После n бросаний при неизменных условиях этого испытания, у нас в результате получится какая-то случайная последовательность. Например, такая:

О, О, Р, О, Р, Р, О, Р, Р, Р, О, О, Р, О, Р, О, О, Р, Р, О. Р, Р.

Иными словами, имеется выборка, в которой две варианты О и Р

Для каждого числа n бросаний монеты можно сосчитать частоту каждой из этих вариант. Сделаем соответствующие расчеты для указанной последовательности.

Из таблицы видно, что на 6-м, 8-м, 12-м и 14-м местах частоты обеих вариант равны 0,5. В остальных случаях частоты отличаются от 0,5, но не сильно. На 7-м месте они равны 0,429 и 0,571, а на 13-м месте – 0,538 и 0,462. И с ростом числа бросаний обе частоты всё ближе и ближе будут подходить к 0,5. Практическое проведение большого числа экспериментов показывает, что частота выпадения орла при достаточно большом числе бросаний практически неотличима от 0,5. Итак, при каждом конкретном числе бросаний монеты частота или, как её называют, эмпирическая частота выпадения герба принимает какое-то конкретное значение. Оно может меняться с изменением числа бросаний. Только вот изменения эти практически незаметны. При достаточно большом числе бросаний частота приближается к некоторому постоянному числу. В данном случае к 0,5. Мы сталкиваемся с замечательным законом природы – статистической устойчивостью.

Определение. При большом числе независимых повторений одного и того же опыта в неизменных условиях частота появления определённого случайного события практически совпадает с некоторым постоянным числом. Это явление называют статистической устойчивостью, а такое число называют статистической вероятностью этого события.

Такая устойчивость имеет место не только при бросании монеты, но и при вытаскивании карт, выпадении определённого числа очков на игральных кубиках, рождении мальчиков, времени восхода солнца и, вообще, для большинства случайных событий. Явление статистической устойчивости соединяет реально проводимые испытания с теоретическими моделями этих испытаний. Приведём несколько примеров, связанных с литературой.

Статистические исследования над большим количеством литературных текстов показали, что частоты появления той или иной буквы (или пробела между словами) стремятся при увеличении объёма текста к некоторым определённым константам. Таблицы, в которых собраны буквы того или иного языка и соответствующие константы, называют частотными таблицами языка. Вот таблица для букв русского алфавита и пробелов (частоты приведены в процентах).

Это значит, что из 1000 случайно выбранных в тексте букв или пробелов буква «ф» будет, в среднем, встречаться два раза, буква «о» - девяносто раз, пробел – 175 раз и т. д. Более того, выясняется, что у каждого автора есть своя частотная таблица использования букв, слов, специфических литературных оборотов и т. п. По этой частотной таблице можно определить автора примерно так же точно, как по отпечаткам пальцев.

Приведём два примера из нашей недавней истории. До сегодняшнего дня не утихают споры об авторстве «Тихого Дона». Довольно многие считают, что в 23 года М. А. Шолохов такую глубокую и поистине великую книгу написать просто не мог. Выдвигались разные аргументы и разные кандидаты в авторы. Особенно жаркими были споры в момент присуждения М. А. Шолохову Нобелевской премии в области литературы (1965 г. ). Статистический анализ романа и сличение его с текстами, в авторстве М. А. Шолохова которых не было сомнений, подтвердил всё же гипотезу о М. А. Шолохове как об истинном авторе «Тихого Дона».

Вторая история носит более политический характер. В середине 60-х годов в одной из стран Западной Европы были опубликованы «очерняющие прогрессивный характер социалистической системы» литературные произведения. Автором был А. Терц и, вне всякого сомнения, это был псевдоним. В соответствующих органах был проведён сравнительный анализ опубликованных «вредительских» текстов и результаты были сличены с произведениями ряда возможных кандидатов в авторы. Ответ оказался однозначным: настоящим автором был литературовед Андрей Донатович Синявский. Он, в общем-то, не отпирался и на суде в 1967 году («Процесс Синявского и Даниэля») получил 5 лет тюрьмы и 7 лет ссылки. Вот такая вот теория вероятностей и математическая статистика.

ДЕШИФРОВКА.

Статистика встречаемости букв незаменима при дешифровке текста, если при его составлении пользовались шифром замены. В нём по некоторому закону (ключу шифра) вместо одних букв использовались другие. Например, вместо буквы А – Я, вместо Б – Ю и т. д. Таким шифром пользовались на протяжении многих веков, пока не догадались, что шифр замены легко раскрыть без ключа. Легко потому, что наиболее часто встречающиеся буквы в зашифрованном тексте соответствуют наиболее часто встречающимся буквам в языке.

Установив такое соответствие, далее используют частые сочетания из двух или трёх букв, например, СТ, ПРО и т. п. Для окончательной дешифровки обращаются к «читаемости» текста, т. е. недостающие буквы восстанавливают, пока не получится осмысленный текст. Этот метод раскрытия шифра простой замены хорошо описали в своих рассказах Эдгар По («Золотой жук») и Артур Конан Дойл («Пляшущие человечки»).

Глава 2. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ИЗУЧЕНИЯ ПРОЯВЛЕНИЯ АЛЬТРУИЗМА У ШКОЛЬНИКОВ.

2. 1. АЛЬТРУИЗМ И ПРОСОЦИАЛЬНОЕ ПОВЕДЕНИЕ

В современном обществе растёт уровень преступности и насилия, и люди всё сильнее беспокоятся по поводу своей личной безопасности и ищут защиты. Одним из способов решения этой обостряющейся проблемы является более активное участие каждого индивида и общества в целом в оказании помощи людям, которым угрожает опасность. Если бы вы попали в беду, вы бы, конечно, хотели, чтобы кто-нибудь вам помог. Почему же не протянуть руку помощи другим? Решение кажется совершенно очевидным. Однако люди иногда не хотят ни во что вмешиваться и не помогают другим.

В психологии альтруизм (фр. altruisme от лат. alter – другой) рассматривается, как нравственный принцип, предписывающий сострадание и милосердие к другим людям, бескорыстное служение им и готовность к самоотречению во имя их блага. В качестве морального требования альтруизм формулируется в противоположность эгоизму, о чем свидетельствуют золотое правило и заповедь любви. Как принцип межличностных отношений альтруизм конкретизируется в принципе справедливости: «Поступай так, чтобы интерес другого человека не становился для тебя средством достижения собственных целей», в принципе уважения: «В своих поступках не ущемляй интересы и права другого человека» и принципе человеколюбия, или соучастия: «Поступай так, чтобы интерес другого человека становился целью твоего поступка». Обращенный к индивиду как к носителю частного интереса альтруизм предполагает самоотречение, ибо в условиях социальной и психологической обособленности между людьми забота об интересе ближнего возможна лишь при ограничении собственного интереса.

Сам термин «альтруизм» был предложен французским мыслителем Огюстом Контом (1798–1857) для того, чтобы выразить понятие, противоположное эгоизму. Контовский принцип альтруизма гласил: «Живи для других». В 19 в. , под влиянием утилитаризма (утилитаризм (от лат. utilitas – польза) – направление в моральной философии, основанное Иеремией Бентамом (Jeremy Bentham, 1748–1832) и развитое под названием «утилитаризм» Дж. С. Миллем (John Stewart Mill, 1806–1873), согласно которому в основе морали лежит общее благо (как счастье большинства людей), или общая польза), альтруизм понимался как ограничение личного интереса в пользу общему, а в некоторых интерпретациях – именно общественному, интересу. В этом плане между альтруизмом и заповедью любви есть существенное различие. С собственно христианской, в особенности православной точки зрения, альтруизм неприемлем как человекоугодие, при котором забывается Бог и обязанность человека угождать Богу и выполнять все его заповеди. Христианская критика альтруизма в 19 в. была обусловлена тем, что концепция альтруизма вырастает из традиций европейского гуманизма, из стремления понять добродетели человека секуляризовано, а нравственность – как выражение потребностей и интересов человека, включенного в отношения с другими людьми, в общественные связи. Вместе с тем, некоторые трактовки утилитаристского понимания альтруизма допускали, что человек, ориентируясь на счастье большего числа людей, позволяет себе причинение некоторого вреда небольшому числу людей. Чтобы предотвратить эти допущения, необходима разработка таких нравственных кодексов, которые однозначно бы устанавливали приоритет правила «Не вреди» над правилом «Помогай ближним». Предлагаются и другие варианты альтруизма: «Живи и дай жить другим» (для большинства обычных людей в обычных обстоятельствах), «Живи и помогай жить другим» – для готовых к самопожертвованию.

Практическая проблема, отраженная в дилемме альтруизм – эгоизм, заключается в противоречии не частного и общего интересов, а моего и чужого интересов. Как видно из определения альтруизма и самого слова «альтруизм», этот принцип повелевает содействовать благу другого человека, возможно, как равного, и при любых условиях – как ближнего. В этом смысле альтруизм необходимо отличать от коллективизма как принципа, ориентирующего человека на благо сообщества (группы). Такое определение нуждается в нормативном и прагматическом уточнении, в частности, по поводу того, кто судит о том, в чем заключается благо другого, в особенности, когда другой не может считаться в полной мере способным самостоятельно судить о том, что составляет его действительный интерес. При формулировке альтруизма, указывающей на необходимость подчинения своего интереса интересу другого, сам принцип альтруизма может быть поставлен под сомнение: как следует поступать по отношению к обидчику, к чинящему несправедливость, к нечестивому человеку? В связи с этим принцип альтруизма может быть уточнен таким образом, что он не распространяется на тех, кто намеренно творит несправедливость и зло. Во второй половине 20 в. альтруизм как особое явление сознания и поведения человека стал предметом специальных социологических и социально-психологических исследований «помогающего поведения». В них альтруизм анализируется в контексте практических отношений между людьми, на материале различных форм солидарности, благодеяния, благотворительности, взаимопомощи и т. д. Альтруизм также переосмысливается в контексте этики заботы. Многие представители эволюционной этики, начало которой положил Ч. Дарвин, указывали на то, что альтруизм как социальное чувство или как взаимопомощь коренится в мире животных и является могучим фактором становления человека. Достижения эволюционной генетики позволили представителям эволюционной этики показать биологические предпосылки альтруизма. Согласно некоторым эволюционным теориям морали (например, П. А. Кропоткина, К. Кесслера, В. П. Эфроимсона), человечество проходило в своем становлении групповой отбор на моральность, в частности, на альтруистичность: выживали те группы, у индивидов которых появляется и закрепляется генетическая структура, определяющая альтруистическое – помогающее, самоотверженное, жертвенное – поведение. Если принять во внимание особенное понимание эволюционистами альтруизма, как такого индивидуального поведения, которое увеличивает возможности приспособления и размножения родственной группы при возможном уменьшении шансов индивида, то становится ясно, что альтруизма был одним из биологических инструментов приспособленности не особи, но родичей, т. е. «совокупной приспособленности». Речь идет именно об эволюционистском понимании альтруизма как механизма внутригруппового взаимодействия. Я заинтересовалась этой проблемой и с помощью эксперимента попыталась выяснить, при каких обстоятельствах человек возьмет на себя роль доброго самарянина и придёт на помощь своему ближнему – человеку, попавшему в беду.

Но помощь оказывают не только в тех случаях, когда она крайне необходима. Существует много способов делать добро другим людям и, таким образом, сделать этот мир лучше. Например, люди могут помочь друг другу делами, оказать денежную помощь или предложить поддержку и утешение.

Оказание помощи другим людям, испытывающим дистресс, кроме всего прочего является ещё и этическим поступком. Это означает, что совершая этот поступок, люди руководствуются этическими нормами и правилами, которым детей учат дома и в школе. Если исходить из теории Фрейда и других теорий личности, то можно ожидать, что при интернализации этих норм возникнут индивидуальные различия, которые приведут к тому, что для разных индивидуумов вероятность оказания помощи другим будет разной. Но ученые, которые недавно провели исследование на тему о вмешательстве очевидцев в чрезвычайные ситуации, не смогли обнаружить личностных детерминант оказания помощи. Количественная оценка тех личностных переменных, которые, как можно ожидать, могли бы коррелировать с оказанием помощи (макиавеллизм, авторитаризм, социальная желательность, отчужденность и социальная ответственность), показала, что по этим переменным нельзя прогнозировать поведение, связанное с оказанием помощи. Такой результат не был обусловлен общей непредсказуемостью исследуемой ситуации, поскольку при изменении условий эксперимента, например при появлении других людей, которые также могли оказать помощь, происходили заметные изменения в уровнях оказания помощи. То есть человек, который вёл себя честно в одной ситуации, вовсе не обязательно будет столь же честным в другой.

Попытки обнаружить корреляции между традиционным для социально-психологических исследований набором личностных переменных и оказанием помощи в чрезвычайных ситуациях оказались довольно-таки безуспешными. Поэтому я решила изучить влияние ситуационных переменных на оказание помощи и выбрала эксперимент как наиболее подходящий метод исследования.

Гипотеза 1. Если люди спешат, когда они столкнулись с ситуацией, в которой требуется их помощь, то они будут менее склонны предложить помощь, чем люди, которые никуда не спешат.

Гипотеза 2. Девушки будут оказывать помощь чаще, чем юноши, т. к. следуя гендерным стереотипам девушки обладают большей эмпатией, сочувствием и сопереживанием, готовностью прийти на помощь.

2. 2. ОПИСАНИЕ И АНАЛИЗ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА ИЗУЧЕНИЯ ПРОЯВЛЕНИЯ АЛЬТРУИЗМА У ШКОЛЬНИКОВ.

Методика

Испытуемые. Эксперимент, состоящий из двух этапов, проводился в МОУ «Ленинская средняя общеобразовательная школа». Испытуемыми были 105 учеников разных возрастных групп и пола.

Переменная: спешка. Эксперимент проводился во время двух школьных перемен – «обеденной» и обычной. В первом случае ребята торопились в столовую, во втором – причин для спешки не было.

Происшествие. После звонка испытуемые выходили из кабинетов. В коридоре они встречали жертву – маленькую девочку с грустным видом. Жертва просила оказать ей помощь - достать рюкзак, подвешенный высоко на стене.

Общее оказание помощи.

Данные исследования можно представить в следующей форме: из 105 испытуемых 15 (14%) предложили жертве какую-либо прямую или косвенную помощь, 90 (86%) не предложили. Распределение процентных долей испытуемых, оказавших помощь, в зависимости от ситуационных переменных было следующим: при низком уровне спешки помощь предложили 19 %, при высоком уровне спешки - 10 %.

Группа Девочки Мальчики

Помогли Не помогли Помогли Не помогли

Спешка 1 15 4 30

Спешки нет 0 29 10 16

Сравнение сделанных ранее прогнозов с полученными результатами показывает, что гипотеза (оказание помощи определяется тем, насколько человек торопится) получила подтверждение.

Вторая гипотеза (девушки будут приходить на помощь чаще) не только не подтвердилась, но и опроверглась. Как ни странно, только 1 из 45 девочек попыталась оказать помощь, остальные просто проявляли любопытство или проходили мимо. Я попыталась объяснить это видом требуемой помощи: достать рюкзак мог только физически развитый человек, а мальчишки, как правило, более спортивны.

ВЫВОДЫ.

Используя методы статистической обработки данных, результаты исследования можно представить в красивой и удобной форме. Статистические методы позволяют подтвердить или опровергнуть гипотезы, достоверность полученных данных, их надёжность; просчитать вероятность события в выборке, большей по объёму. По результатам экспериментального исследования я получила подтверждение одной гипотезы и опровержение другой.

Торопившиеся испытуемые, как правило, оказывали меньшую помощь, чем испытуемые, которые не спешили. Человек, который не торопится, может остановиться и предложить помощь другому человеку, попавшему в беду. Спешащий человек, скорее всего, пройдёт мимо. Проявление альтруизма зависит также и от характера требуемой помощи.

Считаю, что использование методов статистики в разных областях, в частности в психологии, позволяет получить объективные данные.

Комментарии


Войти или Зарегистрироваться (чтобы оставлять отзывы)