sestra_kerry: (Default)
[personal profile] sestra_kerry
Не знаю, чьими стараниями - моего турецкого коллеги, возможно, - на меня напал Turkish Journal of Fishery and Aquatic Science с предложением ревьюировать статью. То, что тематика статьи совершенно не моя, меня удивило, но при пристальном изучении послания я пришла к выводу, что скорее всего, редакторы ошиблись и прислали мне не ту рукопись. Турки такие турки. Первое апреля у них, что ли, сегодня по восточному летоисчислению.

Написала им, что ревьюером быть могу, но не в этот раз, но ради любопытства почитала то, что прислано. Статью, судя по разделу Материал и методы, писали китайцы (причем английский у них еще туда-сюда), но замечательность статьи в том, что авторы написали настоящий научно-фантастический роман с симуляцией исследования.

Они отловили и пропустили через мясорубку гомогенизировали личинок пресноводного краба, которых разводили по двум различным технологиям, и затем (полагаю, на оборудовании, которое стоит больше, чем хороший автомобиль) определили содержание кучи всяких органических и неорганических веществ в мясе оных крабов, а потом "сравнили" качество полученной продукции по этим параметрам. При этом никакой статистики, кроме средняя±станд. отклонение, второй параметр в сравниваемых парах часто с разницей в несколько раз, и они пишут, что "обнаружена статистически достоверная разница" между величинами, к примеру, 4.6±0.95 и 3.5±0.86.

Первое апреля по китайскому календарю тоже?

Date: 2012-06-19 05:10 pm (UTC)
etoile_verte: (Default)
From: [personal profile] etoile_verte
Эх, я так из института и не вынесла, как определяют статистическую достоверность. Вроде единичка, мало, но 4,5 и 3,5 — тоже не много.

Date: 2012-06-19 05:53 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
если доверительный интервал у двух величин перекрывается, то какая же там нафиг статистически достоверная разница? т.е. если в выборках не попались, но теоретически в самих совокупностях могут попасться одинаковые величины, то значит, никакой достоверной разницы между совокупностями по данному параметру нет

Date: 2012-06-19 07:37 pm (UTC)
etoile_verte: (Default)
From: [personal profile] etoile_verte
Э-э... а что тут доверительный интервал и почему он перекрывается?

Date: 2012-06-19 06:09 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
причем, если в качестве доверительного интервала использовано стандартное отклонение, то это значит, что примерно треть всех значений в двух совокупностях будут одни и те же, а это уже никакая не разница :)

Date: 2012-06-19 09:16 pm (UTC)
kastaneda: (Default)
From: [personal profile] kastaneda
Это смотря как они считали. Если измерений много, а инструментальная погрешность невысока — то два заметно перекрывающихся графика нормального распределения таки могут претендовать на статистически достоверную разницу, как мне кажется.

Date: 2012-06-19 09:22 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
они не просто заметно перекрываются, они перекрываются на треть (как я сказала, это средняя плюс-минус стандартное отклонение, по теории в этот разброс должно вмещаться около 30% значений). статистически достоверной такую "разницу" ну никак нельзя назвать, потому что статистически достоверная разница - это вероятность перекрывания максимум 5% значений, а лучше еще меньше.

не говоря уже о том, что совершенно не факт, что распределение значений было нормальным (из статьи этого понять нельзя), не говоря уже о том, что существует куча тестов для сравнения двух средних и еще более куча статистических методов понавороченнее, которые бы приличествовали статье, сделанной на оборудовании такого уровня :) ну и я не читала методику внимательно, там могла быть куча глюков, связанных с автокореллированием данных

Date: 2012-06-19 09:29 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
тьфу, что я говорю. даже не на треть, а как минимум наполовину перекрываются. потому что стандартное отклонение - оно чуть больше сигмы, а средняя плюс-минус сигма, это около 35% значений, и даже в этом интервале есть перекрывание

Date: 2012-06-19 09:42 pm (UTC)
kastaneda: (Default)
From: [personal profile] kastaneda
Не хочу сказать ничего хорошего про эту статью и их методы подсчёта, но я как-то удивлён. В науке я ни бум-бум, термин «статистически достоверная разница» вот только сейчас удосужился погуглить.

Вот, для примера, можно сравнить рост мужчин и женщин. Сейчас посмотрел в рукипедию, там пишут про средний рост 174 и 164 см соответственно. Среднего отклонения не нашёл, но если отбросить по две строчки сверху и снизу вот в этой табличке, то получится два диапазона значений: 160–190 и 150–178. Эти два диапазона весьма сильно перекрываются. Можно ли говорить, что статистически достоверной разницы в росте мужчин и женщин нет?

Date: 2012-06-19 10:05 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
по этой таблице ничего нельзя сказать, нужно взять весь диапазон значений, проверить нормальность распределения и посчитать вот это: http://ru.wikipedia.org/wiki/%D0%A1%D1%80%D0%B5%D0%B4%D0%BD%D0%B5%D0%BA%D0%B2%D0%B0%D0%B4%D1%80%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B5_%D0%BE%D1%82%D0%BA%D0%BB%D0%BE%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5

Date: 2012-06-19 10:09 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
там дело даже не в том, на какую абсолютную величину они перекрываются, а какой процент значений составляет область перекрывания. Если 95% мужчин имеют рост 180-168, а 95% женщин - 167-161, то это можно назвать статистически достоверной разницей с вероятностью 0.05. По крайней мере, это то, что я помню из 3 года назад пройденного курса :)

Date: 2012-06-19 10:41 pm (UTC)
kastaneda: (Default)
From: [personal profile] kastaneda
Так, мне стало интересно. Из википедии я пошёл дальше по ссылкам, взял как пример "National Health Statistics Reports, Number 10, (October 22, 2008)", а из него — All race and ethnicity groups, 20­–29 years. Для женщин 95% значений лежат в диапазоне от 152.2 до 172.8 см, для мужчин — от 164.2 до 190.1:

Percentile
5th10th15th25th50th75th85th90th95th
152.2154.8156.5158.7163.0167.9169.8171.4172.8
164.2167.1169.3172.3177.8183.0185.3186.8190.1

Date: 2012-06-19 10:54 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
ну вот, смотри теперь на область значений между 25 и 75 перцентилем. Они не перекрываются

Date: 2012-06-19 11:00 pm (UTC)
kastaneda: (Default)
From: [personal profile] kastaneda
Да. А почему именно такой диапазон? Это что-то около одной сигмы всего лишь, кажется.

Date: 2012-06-20 08:08 am (UTC)
From: [identity profile] sestra-kerry.livejournal.com
да. я не говорю, что разница средних в одну сигму (для выборки из совокупности - в одно станд. откл.) непременно означает статистически достоверную разницу. Это значит, что больше половины значений выборки (при нормальном распределении их) лежит в пределах средняя плюс-минус сигма. если средние не перекрываются в интервале плюс-минус сигма, мы еще можем говорить о принадлежности двух выборок к двум разным совокупностям, хотя и с некоторой натяжкой. чтобы формулировать это как "статистически достоверную разницу", можно применить ряд методов сравнения средних, начиная от вот такого простенького: http://ru.wikipedia.org/wiki/T-%D0%BA%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0

Date: 2012-06-19 10:58 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
а то, что в статье, это перекрывание даже в этом диапазоне

Date: 2012-06-19 11:24 pm (UTC)
kastaneda: (Default)
From: [personal profile] kastaneda
Вот я задумался ещё о чём: а какова вообще может быть постановка задачи, в которой используются эти цифры. Если у меня есть некое множество американцев всех этнических групп, отобранных по росту ровно 170 см — то я по этой информации не смогу определить, кто входит в это множество.

А если я китайский фермер владелец рыбхоза и мне не надо угадывать, которое из двух нормальных распределений относятся некоторые результаты измерений, а просто надо выбрать одну из двух технологий разведения крабов… то я, пожалуй, больше всего буду заинтересован в среднем арифметическом, и ни в чём больше. Даже если рост какого-то показателя составит всего единицы процентов — это может оказаться важным.

Date: 2012-06-20 08:19 am (UTC)
From: [identity profile] sestra-kerry.livejournal.com
понимаешь, среднее арифметическое вообще очень ненадежный показатель. часто используют другие типы средних, особенно если распределение сильно отличается от нормального. Если размах вариабельности двух выборок сильно отличается (когда стандартные отклонения различаются в несколько раз), сравнивать средние нельзя вообще и нужно применять другой класс методов.

когда для сравнения есть не один параметр, а несколько, как в этой статье (например, есть шесть концентраций тяжелых металлов и нужно сделать вывод, какой из методов позволяет эти концентрации минимизировать), тогда лучше сравнивать сразу всю совокупность данных при помощи таких методов, как ANOVA, ANCOVA, PCA или всяких специальных вариантов, если распределение отличается от нормального (а у меня есть подозрение, что оно отличается). Потом, есть методы, которые учитывают взаимосвязь параметров, в примере с людьми это будет рост и вес (стандартно предполагается, что параметры независимы друг от друга, и если это не так, то возможно серьезное искажение результатов анализа)

Date: 2012-06-20 09:10 am (UTC)
kastaneda: (Default)
From: [personal profile] kastaneda
Про ненадёжность среднего арифметического я знаю (и, например, во многих финансовых показателях меня чаще всего интересует медиана, а не среднее). Среднее арифметическое прекрасно подходит для тех ситуаций, когда мы собираемся прогнозируемые данные суммировать и усреднять. Например, когда речь идёт про то, сколько центнеров чегототам собрали с гектара колхозного поля. И даже большое среднеквадратичное отклонение не будет играть никакой роли, если у нас достаточно больше поле — всё равно мы просто суммируем весь урожай и складываем его в одно хранилище. Я на минутку представил, что у тех крабов оценивается что-то подобное, процент жирів у маслі какой-нибудь.

Пример про тяжёлые металлы достаточно нагляден. Минимизировать вредные параметры как-то психологически труднее, чем максимизировать полезные — хотя с математической точки зрения это одно и то же. Кроме того, эти данные не всегда подлежат усреднению (если не перемолоть партию крабов в фарш): отдельные экземпляры могут иметь слишком высокую концентрацию всякой бяки, даже если в среднем содержание бяки в допустимых пределах.

Date: 2012-06-20 09:58 am (UTC)
From: [identity profile] sestra-kerry.livejournal.com
>отдельные экземпляры могут иметь слишком высокую концентрацию всякой бяки, даже если в среднем содержание бяки в допустимых пределах.

воот. это-то как раз и будет видно по стандартному отклонению, а еще лучше по сырым данным, расположенным на графике (ни одного графика, кстати, в статье нет)

Date: 2012-06-20 08:29 am (UTC)
From: [identity profile] sestra-kerry.livejournal.com
понимаешь, если тебе нужно сиюминутно выбрать технологию для разведения крабов, то все средства хороши. можно даже подкинуть монетку и понадеяться на удачу. Если у кого-то на севере Китая в их климате метод работает лучше, то на юге Китая он может работать по-другому и тут поможет только опыт и метод проб и ошибок.

но в данном случае товарищи пишут научную статью, и поэтому их выводы должны быть надежно обоснованы, как обобщение. а здесь просто частный случай небольшой разницы в параметрах, ее нельзя подавать как доказательство преимущества одного метода над другим

Date: 2012-06-19 10:20 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
а вот если бы, наподобие как ситуация в этой статье, средний рост мужчин был бы 174 при интервале 160-190 и стандартном отклонении плюс-минус 5, а средний рост женщин, к примеру, 168 с размахом 156-180 и сд, скажем, 4 - то опаньки

Date: 2012-06-19 05:22 pm (UTC)
From: [identity profile] al-dragon-net.livejournal.com
На арХиве сегодня опубликована статья про форму озёр на кубической планете: http://arxiv.org/pdf/1206.3857v1.pdf
Может, и правда какой-то специальный день? %)

Date: 2012-06-19 05:29 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
гравитационное поле куба, хаха. любопытно, надо почитать, просто ради смеха :) планета правильной кубической формы, не вращается, висит себе кубиком в пространстве после того, как ее вырезали из межзвездного вещества чьи-то умелые руки?

Date: 2012-06-19 05:34 pm (UTC)
From: [identity profile] al-dragon-net.livejournal.com
Вращающийся вариант там тоже рассмотрен. И влияние вращения на орбиты спутников, обращающихся вокруг кубика размером с Землю.

Следующий этап, видимо — геометрическими примитивами описать черепаху, слонов и Диск и посчитать орбиты вокруг них.

Date: 2012-06-19 05:38 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
ну, они пишут, что их метод можно применить для описания полей более сложной формы (если я правильно понимаю, разбить на кубики), стало быть, не такая уж и глупость. разбить объект неправильной формы на шарики будет сложнее.

а черепаха будет вращаться вокруг Солнца? или болтать ногами в пространстве, а Солнце вращаться вокруг нее?

Date: 2012-06-19 05:50 pm (UTC)
From: [identity profile] al-dragon-net.livejournal.com
В этом смысле да. Но называть рассматирваемый кубик "планетой" — по-моему, все же чересчур сильный ход.
Хотя, возможно, я просто завидую такому творческому подходу к публикациям :)

Однозначно Солнце вокруг черепахи. Черепаха вокруг Солнца — это слишком эклектично.

Date: 2012-06-19 07:38 pm (UTC)
etoile_verte: (Default)
From: [personal profile] etoile_verte
А вращение через рёбра или по диагонали?..

Date: 2012-06-19 09:50 pm (UTC)
From: [identity profile] nassims.livejournal.com
а тебя раньше не приглашали в рецензенты? видно попала в базу, теперь держись, китайцы писучие и в рецензенты журналы забривают все что дышит и шевелится. Западные учоные уже посылают сразу, разве что предложение рецензировать приходит из ОЧЕНЬ хорошего журнала.

Date: 2012-06-19 10:50 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
меня приглашали (наши, не китайцы) и даже один раз я пригласилась, после чего отбрыкивалась как только можно. журнал, как сказано, турецкий (насколько хороший или плохой, понятия не имею, но подозреваю, что до передовых рубежей науки им как до Киева пешком). А статья, скорее всего, попала по ошибке, потому что в футноут стоит другое название, как раз с моей темой связанное.

эту я привела как пример того, что даже при моей тупости как ученого бывают статьи в зарубежные журналы, потрясающие меня своей тупостью
Edited Date: 2012-06-19 10:50 pm (UTC)

Date: 2012-06-20 12:03 am (UTC)
From: [identity profile] nassims.livejournal.com
ну какая там у тебя "тупость ученого", не смеши :)

а с китайцами - пусть пишут фигню, лишь бы не воровали результаты.

Date: 2012-06-20 08:21 am (UTC)
From: [identity profile] sestra-kerry.livejournal.com
они еще и результаты воруют о_О

Date: 2012-06-21 08:05 pm (UTC)
From: [identity profile] daria-me.livejournal.com
Ну акая Вы клаааасная)
Вот такой разумный комментарий ученого, да))

Date: 2012-06-21 08:14 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
не надо так шутить над безобидным биологом! нас математике на первом курсе учили, и то страшно криво (а тех китайцев, похоже, не учили вообще)

имею я право побурчать по поводу тупости, которая больше моей собственной, в моем собственном жж или нет? :)

а поскольку я, кажется, снова аспирант, то выкать бессмысленно, давай(те) на ты?

Date: 2012-06-21 08:20 pm (UTC)
From: [identity profile] daria-me.livejournal.com
я серьезно)
безотносительно конкретного поста, а вообще!
честно-честно!)

да, конечно, на ты будет лучше.
привет

Date: 2012-06-21 08:26 pm (UTC)
From: [identity profile] sestra-kerry.livejournal.com
окей :) рада, будем тогда знакомы :)

*если что, я правда очень тупой ученый, просто даже таким, как я, все еще платят*

я убегу до выходных, потому что завтра утром у меня собеседование в эту самую очередную аспирантуру, но потом скажу еще всего разного. "автостоп" и "грузинский язык" в интересах - это руль!!!

Date: 2012-06-21 08:31 pm (UTC)
From: [identity profile] daria-me.livejournal.com
)) я тоже не ученый-Ученый, а так. любопытство - не порок и все такое.

удачи на собеседовании)

*хотя блин, чтоб я да еще раз кого-то бы поддерживала и обобряла в решении ввязаться в аспирантурную авантюру..))*

Date: 2012-06-23 09:14 am (UTC)
From: [identity profile] sestra-kerry.livejournal.com
ну, это у нас наука считается любопытством, а на западе этим даже можно зарабатывать (правда, не всегда и не везде)

собеседование прошло успешно и было чисто формальным, зато местные бюрократы прицепились к моему университетскому диплому на предмет его соответствия чешскому магистерскому. но это утрясем.

дада, меня только под дулом пистолета можно было бы еще раз заставить туда поступать. но штука в том, что на данный момент это наиболее спокойный и наименее болезненный для меня способ легально работать в ЕС (полставки научного сотрудника мне таки собираются дать, поскольку одна степень уже есть) и по ходу переучиваться из зоологов в генетики и молекулярщики.

я была в восторге от идеи поступления в аспирантуру без экзаменов, но вчера мне сообщили, что меня и от повторных кандминимумов при желании избавят (хотя я хотела бы сдать английский и специальность все равно, просто для себя). Зато пахать на статьи придется как проклятой

Date: 2012-06-24 02:01 am (UTC)
From: [identity profile] nassims.livejournal.com
вот еще прекрасная история

Date: 2012-06-24 02:01 am (UTC)
From: [identity profile] nassims.livejournal.com
http://afranius.livejournal.com/216606.html

Date: 2012-06-24 08:29 am (UTC)
From: [identity profile] sestra-kerry.livejournal.com
да уж, прекраснее некуда, только с другой стороны.
я пока ничего супервыдающегося открывать не собираюсь, но на всякий случай возьму на заметку

December 2025

S M T W T F S
  1 234 56
7 89 101112 13
14151617181920
21 2223 24 2526 27
28293031   

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 29th, 2025 09:46 pm
Powered by Dreamwidth Studios