Как попасть в AF?

Владислав Тарасюк “Проблемист Украины” №1 2021.

В октябре прошлого года закончился отбор в этюдный раздел очередного Альбома ФИДЕ 2016–2018 (судьи Олег Перваков, Мартин Мински и Владислав Тарасюк). В отличие от моих коллег, это был мой первый судейский опыт на уровне Альбома. В отборе участвовало 919 этюдов-кандидатов. Количество отобранных работ – 227, что составило 24,7% от общего числа. В этот раз в Альбом попало намного больше этюдов, чем в предыдущих циклах: в 2010–2012 гг. было 122, а в 2013–2015 гг. ещё меньше – 107. Бытует мнение, что попадание в Альбом – это в некоторой степени лотерея…

Всего в отборе участвовало 113 авторов. Работы 52-х этюдистов получили прописку на страницах нового Альбома ФИДЕ. Это был действительно плодотворный период в творчестве многих коллег, особенно это можно сказать о призерах последнего чемпионата мира. По итогам этюдного раздела 2-й призер Martin Minski выполнил норму международного гроссмейстера, а 3-й призер Steffen S. Nielsen, как и автор этих строк, стали международными мастерами…

Лучшим этюдом в отборе стал №1, набравший в сумме у трёх судей Альбома максимальные 12 баллов!

И, всё-таки, с учётом многих отличных работ, попавших в Альбом, очень удивило совсем мизерное количество судейских 4-балльных оценок. Так, например, у M.Minski и М. van Herk (директора раздела) было по одной такой оценке, В.Тарасюка – четыре, а у О.Первакова, вообще, не оказалось этюдных оценок в 4 балла… А ведь были ещё шедевры! Например, следующие два этюда №2–3, которые, хоть и получили от трёх судей “всего лишь” 10 баллов, но стали одними из этюдных украшений нового Альбома ФИДЕ.

Так, в этюде №2 автором представлена отличная реализация сложной и очень оригинальной идеи.

А вот в этюде №3 соавторы реализовали непростой фокус с одновременной поимкой двух ферзей … двумя конями!

Этюды №2–3, из категории работ, которые не просто запоминаются, но и уникальны! Ведь осознать эти идеи – это одно дело, а заставить их работать – настоящее чудо! Подобные работы не так часто можно встретить в итогах конкурсов и судьи Альбома, руководствуясь каждый своими критериями оценки, явно недооценили их сполна. При этом неудивительно, что оценки к другим, «менее» привлекательным этюдам получили от судей достаточно высокие 3,0 и даже 3,5 балла. Можно ли, например, в один ряд с показанными выше работами поставить следующий этюд №4?

Этому привлекательному, но, всё-таки, схематичному этюду один из судей дал 3,5 балла (неужели, только лишь за один ход ферзя 3.Qh8! в угол?), что очень помогло работе набрать 8 баллов и попасть в Альбом. Но ведь, сама жертва ферзя с угрозой сдвоения со слабейшей фигурой – слоном впереди (тема Лойда-Тертона) не очень впечатляет и чёрные, при этом, совсем не борются?!

Замечу, что другим подобным этюдам с одним «ярким» ходом «повезло» намного меньше. Например, этюду № 5, в котором с переменой сторон, представлен оригинальный «рецепт» преодоления известной идеи знаменитого этюда братьев Сарычевых, тот же судья поставил 1,5 балла.

А вот два интересных и, по-своему, уникальных этюда №6–7 со строгой экономией сил и очень хорошей техникой. Жаль, но им не удалось набрать нужное количество баллов для попадания в Альбом. Опять сказались «слишком» строгие подходы судей к оценке этюдов?

Среди всех этюдов-кандидатов, авторы представили 29 малюток. В новый Альбом попала лишь одна из них и то, благодаря последнему WCCI. Остальные, не были замечены судьями, получив, в основном, низкие оценки. В том числе, и эта, элегантная малютка №6 с классической техникой блокирования пешки двумя конями в линии Троицкого.

Дважды (2.Kf5!! и 5.Ke6!!) белый король парадоксально уходит из-под блокированной им чёрной пешки, ради удачной её задержки одним из коней в финале. Удивительная находка (её уникальность – в простоте и 5-ти (!) фигурах), которую положительно мог бы оценить и сам Алексей Троицкий.

Уникальность этюда №7 – в очень экономной реализации идеи ухода короля в угол не из-под шаха. И это в непростом ферзевом (!) окончании при двух пешках. Примечательно, что в ложном следе чёрные спасаются маневром своего короля также в угол, но на противоположной части доски.

Справедливости ради отмечу, что судьи, вместе с директором раздела, несмотря на разный стиль оценивания, всё же стремились определить лучшие работы в этюдном разделе. Была проведена большая работа по проверке на предшественников и корректность. Martin Minski для удобства работы судей создал PGN-файл всех поступивших этюдов. При этом он обратил внимание на необходимость изучения и PDF-файлов с авторскими комментариями. Директор раздела Marcel van Herсk по итогам общих судейских оценок подготовил отдельную таблицу с 84-мя этюдами, получивших предварительно 7,5 балла. Он предложил судьям дополнительно пересмотреть эти этюды и определиться, например, с оценкой в 2,5 балла – если бы конкретно отдельная работа заслуживала, по мнению у кого-то из судей, быть в Альбоме, то можно было ему поднимать свою оценку до 3,0 баллов или, наоборот, понижать до 2,0 баллов. Итогом непростых совместных дискуссий стало дополнительное попадание в Альбом ещё 45-ти этюдов разных авторов, в частности, Y.Afek, B.Djurasevic, M.Gonzalez, M.Hlinka, L.Kekely, J.Polasek, J.Timman, E.Vlasak, П.Арестов, П.Киряков, А.Сочнев, А.Ставриецкий и многих других.

Но судейский диалог иногда не был результативным, что, так или иначе, повлияло на отбор. Не хватало более открытой атмосферы взаимного общения, а также сказалось наличие у судей различных критериев оценки этюдов. С одной стороны, – это «нормально» (на вкус и цвет товарищей нет!), с другой – это проблема, которая сама по себе не нова. Вспомним, хотя бы недавний и показательный случай непопадания в Альбом ФИДЕ 2013-2015 этюда №7 (судьи Richard Becker, Martin Minski, Ladislav Salai).

Это полноценное сражение с великолепной игрой фигур обеих сторон не смогло набрать от трёх судей АФ 2013–2015 даже минимальные 7,5 баллов, которые были необходимы для попадания этюда в Альбом прошлого цикла.

Какой можно сделать вывод на обозначенную тему – как попасть в Альбом ФИДЕ?

Считаю необходимым попытаться разработать критерии оценки шахматного этюда, перечислив конкретные позиции (достоинства и недостатки), и их официально утвердить. Это может и должно стать руководством для работы судей в следующих Альбомах. Согласен с Сергеем Дидухом, что «искусство оценивания этюда состоит в том, чтобы разглядеть за его скорлупой (начальной позицией и главным вариантом) его нутро (всё содержание) и выделить в нём главное и второстепенное. Второстепенное часто мешает главному, и это является источником основных проблем современного этюда». Также поддерживаю мнение Владимира Самило, который считает, что «одним из приоритетных критериев оценки этюда при отборе может быть уникальность выражения идеи».

В то же время, при этюдной комиссии WFCC на постоянной основе необходимо создать апелляционную комиссию или же совет старейшин, состоящий, например, из чемпионов мира прошлых лет, для рассмотрения спорных случаев при отборе в Альбом ФИДЕ. Такая процедура даст возможность авторам использовать право на защиту своих произведений, что может иметь решающее значение в вынесении справедливого окончательного решения. При этом, создание апелляционной комиссии должно поднять и ответственность самих судей, которые дают согласие работать не только в Альбомах ФИДЕ, а также и в официальных турнирах (Кубка мира и Олимпийского турнира).

Очень важно, чтобы и каждый автор этюда был более объективным и требовательным в оценке своих работ при их посылке в Альбом: зная принятые критерии оценки, автор мог бы прогнозировать результат. Тогда, возможно, не будет и значительного количества работ низкого качества, что наблюдалось в отборе этюдов к последнему Альбому ФИДЕ. Всё это в комплексе должно облегчить работу судьям по проверке и оценке этюдов, и, в конечном счёте, к более объективному качеству отбора.

Затронутые в статье вопросы, конечно же, непростые и требуют открытого обсуждения и соответствующей разработки.

49 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии
Перваков
Перваков
2 лет назад

Влад, статья неплохая. Но в отношении этюда Самило не согласен. Кроме Кf5 и Ке6, коим ты даёшь аж по два восклицательных (??), у белых вообще нет ходов. Или ты считаешь ходы конем под их стреноживание королем черных адекватными? Спроси у Кирякова – он бы их вообще в партии не рассматривал, так, Петр?

Владислав Тарасюк
Владислав Тарасюк
2 лет назад
Ответ на  Перваков

Олег, за белых ещё есть 6.Nc4! вместо 6.Nd5?

Любопытно, что до Самило никто ранее не додумался, дважды “отпускать” уже заблокированую пешку королём, а потом её задерживать одним из коней. Конечно, это просто, но это всё в малютке!..
А в многочисленных этюдных примерах пешка, в таких случаях, просто убегала и чёрный король получал всевозможные маты, что сейчас уже трудно этим кого-то удивить.

Да, и ещё есть такое понятие как альбомный этюд… Должен ли он быть обязательно мощным и масштабным?!

karya
karya
2 лет назад
Ответ на  Перваков

Олег! По  поводу  твоего  с  Михаилом  (№1). У  меня есть  серьёзные  сомнения в  отношении  его  корректности:  7.Qc8+ Qe6  (7…e6  8.Rf2 – поз.1)  8.Qc5+Kf6  (8…Kxf4  9.Qc1+ +/-)   9.Be5+  Kf7  10.Rf2+ – поз.2.  В  поз.1 и  поз.2  у белых  лишний слон.  Как  правило,  в  таких  ситуациях  сильнейшая  сторона  побеждает!   8-фигурные  базы  появятся  лет  через  10,  а  для  ручного анализа  поз. 1   и   поз. 2  понадобится   500 лет!  Выбирай:  жди  базы  или  анализируй  вручную!

Перваков
Перваков
2 лет назад
Ответ на  karya

Валера, во первых, ход 7…е6 быстро проигрывает, а вот после 7…Qe6…10…Kg8 черные достаточно быстро вынуждают белых разменять ферзя или ладью, слишком плох белый король.

Перваков
Перваков
2 лет назад

Влад, не уверен, извини… Но этюд не для Альбома. Спроси Серёгу Ткаченко, он авторитет для меня в этом материале

Владислав Тарасюк
Владислав Тарасюк
2 лет назад
Ответ на  Перваков

Олег, в целом, этюды прошлого цикла – это уже история… Я думаю, всё-таки, нужно попытаться вместе разобраться с критериями оценки. Указать, что такое достоинства и недостатки в этюдах, и учитывать это судьям при своей работе. В любом случае, это должно быть всем нам на пользу, а особенно, самому Этюду.

Гуров
Гуров
2 лет назад

Владислав, я не этюдист, но имею опыт судейства коопматов – 3 раза. Разобраться с критериями – это утопия. Увы. У вас все нормально, по сравнению с нами, вы хоть отобрали много.

Владислав Тарасюк
Владислав Тарасюк
2 лет назад
Ответ на  Didukh

Сергей, согласен с тобой. Помимо критериев, очень важно забыть о симпатиях и антипатиях к авторам этюдам.

Гуров
Гуров
2 лет назад

пункты 2 и 3 сомнения не вызывают. А пункт 1… В последнем альбоме я дал задаче Петкова 4 балла. Это одна из лучших задач за последние 10 лет в h#2, которую я видел. Мог дать и 3,5, но подстраховался и дал именно 4. И что же? Два других подельника дали по 2(!!!) балла. Что они там не поняли или к чему придрались, я не знаю, но если бы не моя оценка – задачи в альбоме бы не было! Это меня так поразило и разозлило, что я больше не хочу тратить свое время на это мероприятие.  Я пять раз просматривал задачи 2,5 и выше, а они взяли и чуть не зарезали….

Владислав Тарасюк
Владислав Тарасюк
2 лет назад
Ответ на  Гуров

Валерий, если и дальше не разбираться с критериями, то тогда точно будет утопия… Ведь не каждый может ставить 4 балла и “спасать” 😎 работу, как делал ты в разделе кооперативных задач.

Валерий Гуров
Валерий Гуров
2 лет назад

Увы, не достачно спасал, надо было 4 балла ставить налево и направо. И ведь подельники то не желторотые, а известные и уважаемые люди 🙂  А ты про критерии тут говоришь….

Владислав Тарасюк
Владислав Тарасюк
2 лет назад
Ответ на  Валерий Гуров

Валерий, если не говорить об этом, то тогда всё останется на прежнем месте. А это тоже не правильно, например, завышать баллы одному судье для подстраховки от слишком других строгих судей.

Кстати, была попытка директора раздела кооперативных задач, где ты был судьёй, прокомментировать судьям свои разные баллы к некоторым задачам? Я имею ввиду разнобой баллов, например 4 + 2 + 2. Или задача прошла в Альбом и пусть так остаётся?

Гуров
Гуров
2 лет назад
Ответ на  Валерий Гуров

Я сразу написал директору, что офигеваю от такого судейства и привел в пример именно эту задачу. Так что попытки не было 🙂 Там же пытаются урезонить арбитра, который именно выделяется своей оценкой – а это был я :-)) Но я и в первом своем судействе так делал – когда протащил миниатюру Степочкина, понимая, что могут зарезать. Но там я явно балл, а то и полтора,  добавил, а здесь у меня просто нет слов. Но подождем, что Петков скажет, когда это увидит 🙂

Владислав Тарасюк
Владислав Тарасюк
2 лет назад

В этюде Ткаченко уход двух ладей и коня – всё-таки большая цена для реализации несложной идеи. Не экономно. Интересно эта работа попала в Aльбом?!

Что касается части игры после 7-го хода белых (малютка):

1. В конце ложного следа чёрному королю необязательно близко стреноживать коней – вместо 7…Kf6 достаточно и 7…Ke6 с последующим 8…d5

2. А вот дуалька 10. Ke3(e4) и ещё другая дуаль 13.Ne4+ на последнем ходу решения смазывают восприятие финальной игры и снижают впечатление… У Самило везде всё чисто – в решении и ложных попытках.

Martin Minski
Martin Minski
2 лет назад

The other day I showed a chess friend Costeff’s study with a caged rook (2nd special prize of Krug-50). He was amazed that I rate such a “funny gimmick” so highly. What do I mean by that? There is no such thing as an objective truth. Every judge may see it a little differently. The most difficult problem is how to evaluate (partial) anticipation. The question is what kind of personal contribution and improvement can be recognized in a study “according to Sarychev”, for example. That is still difficult for me (and certainly other judges). When in doubt, I ask expert colleagues to objectify my judge’s decision.

Some here demand that one should not decide based on sympathy for the composer. That goes without saying for me and certainly for every judge.

Colleague Tarasiuk should note that he did not “buy” the absolute truth either. Everything he writes in his article is his personal opinion. If he doesn’t want to see a study by Costeff (Turton with Qh8 !!) in the album, then he has to give the appropriate points and not “Maybe”.
A baby (5 pieces) that is perfect doesn’t have to be in the album. There is no automatism.
As a FIDE judge, I take notes on every study. I write down the advantages and disadvantages. In the end, I have to feel that this study belongs on the album. Any study that I rate highly has to appeal to me emotionally, regardless of style or author.
The 3 independent judge system has its weaknesses. There are always tragic decisions, like the study by Oleg from Tata Steel. I gave it 3 points at the time and thought that with 9 points this study would be safe in the album. It turned out differently because one judge was against (for whatever reason) and another judge was unsure.

There are always small and (sometimes perhaps large) injustices. Nevertheless, I consider the judging system to be overall successful. Our director Marcel van Herck confirmed that all three judges, with a few exceptions, had a very high degree of agreement.

As a composer or as a judge, I have always accepted that other judges may have different opinions about my studies. I am not subjecting any other judge to bad intentions. Therefore, it would never occur to me to write an article complaining about a single study that I find undervalued.

I do not consider another committee with possible complaints afterwards to be practicable. I think the FIDE Album Commission is happy to have three judges and a director for each section who volunteer so much work. In our small society there are no more staff.

Yes, yes, Oleg, I’m conservative and don’t want to change anything. 🙂

Владислав Тарасюк
Владислав Тарасюк
2 лет назад
Ответ на  Martin Minski

Мартин, я написал статью не с жалобой на один этюд. Ты не прав – читай внимательнее. Одна из моих целей в статье – уменьшить трагические ошибки непопадания в Альбом достойных этюдов. Если бы ты, например, дал тогда этюду Первакова из Tata Steel не 3, а 3,5 балла, как и этюду Costeff с ходом Qh8!, то он тоже был бы в Альбоме. Разве этюд Олега был хуже!?

И я считаю неправильным, когда “судьба” попадания в Альбом зависит от одного судьи, давшего очень высокий балл на фоне низких баллов двух других судей (например 2 и 2,5 балла). Здесь либо один судья заблуждается, либо остальные двое судей правы, что этюду не место в AF. В этом случае нужен результативный диалог судей, желание слышать друг друга в своих аргументах, что не хватало нам в отборе к последнему Альбому. Этому нельзя научиться сразу за один месяц или год, но мы должны учиться и стремиться меньше ошибаться при оценивании этюдов. Без общепринятых рекомендаций с критериями оценивания этюдов, проблема будет оставаться и дальше нерешённой.

Не думаю, что аппеляционная комиссия не нужна. В том же случае с этюдом из Tata Steel, Олег или возможно другой автор мог бы обратиться в комиссию и имел шанс на более справедливое решение. Почему авторы не должны иметь на это право? Также они имеют право и на открытую публикацию баллов не только ко всем этюдам, но и задачам, полученных при отборах в Альбомы. Тогда и судьи будут ответственнее при оценивании работ и, возможно, меньше станет “друзей” друг у друга.

Martin Minski
Martin Minski
2 лет назад

Vladislav, maybe you are wrong too.
The whole way you act is presumptuous.
You want to explain to me that I should give a study 0.5 points more or less.
Who are you ?

I’m not starting to think about your reviews and I still know where up and down is.

Владислав Тарасюк
Владислав Тарасюк
2 лет назад
Ответ на  Martin Minski

Мартин, я также ошибаюсь, как и все. И я могу заблуждаться. Но мы должны вместе все учиться и меньше ошибаться. Или дальше делать вид, что у нас в этюдах всё хорошо, раздавать призы и красиво улыбаться…

Martin Minski
Martin Minski
2 лет назад

Vladislav, the difference between us is that I am not writing an article and indirectly claiming that my fellow judges made mistakes.

There is at least one study of yours with 6 pieces that goes into the album. So the other judges are not fundamentally against studies from the database. But you present other studies, including one of yours that does not make it into the album, and complain.

I’m just mirroring your behavior.

 

You want objective criteria. If it were that easy …

If you can find a formula for it, then we no longer need a person as a judge. Then the computer can figure it out. I don’t think there will ever be, because studies evoke emotions that only humans can feel.

 

I think that Costeff’s study with Turton and Dh8 should be on the album!

Now I learn from your article that I made a “mistake”. What’s all this about ?

 

You propose a committee to avoid these “mistakes”.

Should there ever be such a committee I’m no longer a FIDE album judge.

Владислав Тарасюк
Владислав Тарасюк
2 лет назад
Ответ на  Martin Minski

Мартин, я не писал в статье, что ты ошибься. Читай внимательнее…

Ты дал этюду Costeff с Qh8! дал 3,5 балла. Разве за один ход дают такую высокую оценку!? Почему ты тогда не ставил такие оценки другим этюдам с одной пуантой? Повторюсь, разве можно сравнить Turton с этюдом Gady из P.Krug-50 JT ?

Martin Minski
Martin Minski
2 лет назад
Ответ на  Martin Minski

Vladislav, yes, I think my ratings for Costeff’s studies are appropriate.

I can also ask you why you rate both studies so differently. But I don’t do that, at least not in a public article!

There is a good reason why ratings of the FIDE album should not be publicly available in order to avoid endless discussions.

You broke this rule.

You don’t say my name directly, but you know that I read this.

Why don’t you ask me in a personal email why I gave this or that rating?

You probably see yourself as the savior of the FIDE album.

Sergiy told you how to rate the failed studies you showed.

You don’t even believe him.

Martin Minski
Martin Minski
2 лет назад
Ответ на  Didukh

My chess friend is Jan Sprenger.

I showed him Costeff’s study yesterday.

Tarasiuk evaluates the other judges. That’s strange.

Jan Sprenger
Jan Sprenger
2 лет назад
Ответ на  Didukh

Sergiy, I am the first to admit that I need to study the history of the endgame study  better. This is because I started composing recently. But I do not think that the fact that I did not know Costeff’s study before disqualifies my judgment. The judgment should be evaluated in the light of the provided reasoning. And when I try to fill the gaps in my knowledge, I prefer to focus on Troitzky, Mattison, Kasparyan, Kazantsev, Liburkin, and some more modern classics like Kralin and Ryabinin. Not on the most recent stuff (this is not intended as a quality judgment). Same in music conservatory. For example, you learn the principles of counterpoint with an analysis of Bach’s fugues and not with Schönberg’s “Verklärte Nacht” (even though I like that piece a lot!).

Coming to Costeff’s study. I admire Gady’s technical skill. It looks almost like a miracle to me to have implemented this theme. Nonetheless, I said “Spielerei”. This is more abstract than the english “gimmick” and perhaps closer to the Russian “tryuk”. Spiel, “play”, is in it, but not in the slightly pejorative sense of “gimmick” and “gadget”. Why couldn’t I take the study fully seriously? Because first of all, a study should be an endgame study. Not unlike Timman’s and your study in UAPA-13, this work looks a bit like a problem dressing up as a study.

Of course this is a very good composition. But 10,5 is a very rare score in evaluations. This should (according to my conservative, classicist criteria) be reserved for studies which—apart from intensity of content, orgininality, etc.—satisfy a high degree of elegance, openness and naturalness. Ideally also more counterplay (in this kind of tactical studies) and no humanly unclear sideline like the 6. …c4 line. That’s why I was surprised when Martin told me the score. (“10,5 Punkte??? Für diese Spielerei?”)

There are, in my view, way more significant studies in the classical or logical style that finish with something between 8 and 10 points. I have, like Vladislav, also the impression that studies in the 5-8 piece range have a harder time with some judges, all other things being equal. (This observation is not about the FA because I did not study the scores closely.) But even an otherwise incompetent judge will see that there is something special about Costeff’s study while he may miss out on studies where the content is more hidden.

I would probably have included Costeff’s study in the album, too, because it is a significant technical achievement and, as far as I know, an original theme in the study domain. One should always be open to other approaches to composition or at least make an effort. But I think there is more that distinguishes an endgame study from a direct mate problem than the stipulation.

Jan Sprenger
Jan Sprenger
2 лет назад
Ответ на  Didukh

I like Gurvich’s propaganda and I do think I have a grasp of economy. But I also like the comparison with the Vatican. 😉

Probably the better comparison is again from music. Take 19th century music. You have those who search radically new forms, like Berlioz and Liszt with program music and symphonic poems, or Wagner with the music drama. And you have those like Mendelssohn and Brahms who follow the aesthetic ideals of Mozart and Beethoven, but give a very personal and unique note to them.

I think both paths are legitimate. I am definitely in the second camp. But it may from time to time be interesting to visit a concert with music from the first group.

(By the way, it is Gurvich who justifies his propaganda with universal aesthetic principles!)

Sergiy, yesterday I wrote two longer posts here responding to Vladislav but they were “pending approval”. I still don’t see them. Could you approve them? Or shall I repost? Thank you.

 

Ilham
Ilham
2 лет назад
Ответ на  Martin Minski

Мартин, ты противоречишь сам себе, Костеффу можно, а Жукову нельзя…

Martin Minski
Martin Minski
2 лет назад
Ответ на  Ilham

Ilham, unfortunately, I don’t understand the comparison with Zhukov. Can you explain your remark to me in more detail?

I only have one idea: You might think that I regard Costeff’s study with Qh8 as a “one move study” (according to your videos, which I still think are good, by the way). That’s not true. It’s a wonderful implementation by Turton in a study (very rare) with the point Qh8 (I only called it that because it’s convenient). I think this study belongs on the FIDE album. Do I have to be ashamed of it? I ask the other readers.

Ilham
Ilham
2 лет назад
Ответ на  Martin Minski

Я не говорил, что этюд Костеффа плох. Просто 3,5 слишком много.

Martin Minski
Martin Minski
2 лет назад
Ответ на  Ilham

I accept your opinion. Maybe my rating was a little too high.

A question to you: Should the study be in the album? Yes or no?

Ilham
Ilham
2 лет назад
Ответ на  Martin Minski

Xотя, к одному этюду у меня большие претензии. Я вам напишу на e-mail

Martin Minski
Martin Minski
2 лет назад

Indeed, that’s presumptuous. Vladislav thinks that Costeff’s Turton study does not belong in the album. But the other judges see it differently. He presents his opinion as absolute truth. I find the whole article absurd and embarrassing.

Владислав Тарасюк
Владислав Тарасюк
2 лет назад

Мартин, даже если твои оценки к этюдам были по-твоему адекватными, они всё равно должны оставлять за собой сомнения. Никогда не будь уверенным, что ты поступил правильно. Нужно иногда сомневаться и анализировать – это предварительное условие, необходимое до начала осмысленных действий.

Yarrog
Yarrog
2 лет назад

Я еще не получил № журнала.

Влад, статья хорошая, и написана отлично. Но я не верю в изменения.

3 судьи – 3 разные мнения. Потому что у каждого свой вкус.

Насчет этюдов мне трудно судить, хотя могут быть личные предпочтения у судьи, как-то: классическая/романтическая форма, идеальный конец и т.д. и т.п. Я больше разбираюсь в задачах, и даже когда-то судил многоходовый раздел Альбома Украины. В задачах еще больше разных направлений: логические, ново-стратегические, “чешские”. Судить Альбом может (должен) тот судья, который работает во всех направлениях! Мне кажется, в этом “зарыта собака”, то есть скрыта истина. Судья – универсал! (Примеры – не идеальные, но все же: В.Руденко, Я.Владимиров, Ю.Гордиан). Но вот таких последнее время остается все меньше. И я не думаю, что ближайшее время найдется универсальный способ оценки отбора задач и этюдов в Альбомы.

Jan Sprenger
Jan Sprenger
2 лет назад

Vladislav, I think you are right that it is important to reflect on criteria, things that do not go well, etc. I am a bit less sure that a public discussion of the judging process for one particular FA from the point of view of an insider is the right way to start this discussion. I think this is what annoyed Martin. But anyway. Let’s talk about the general problem, which is interesting.

Preliminary remark: I am a researcher in philosophy of science and so I am inclined to think that the problem of judging chess studies is somewhat similar to the problem of comparing scientific theories, or of comparing artworks. I think both science and chess composition are characterized (here I follow a classical text by Thomas S. Kuhn from 1977: https://www.andrew.cmu.edu/user/kk3n/philsciclass/kuhn.pdf)

—the presence of generally shared criteria for evaluation (for scientific theories, some of the most common are logical consistency, predictive accuracy, explanatory power, coherence with other theories, simplicity, etc.)

—the fact that various people assign a different relative weight to these criteria, creating dissent in spite of the fact that we have a shared set of criteria.

For example, I find it more important than some composers and judges that a study is not too heavily analytic. Others may be inclined to accept more analytic lines if this contributes to economy or intensity of expression.

This has the consequence that it is hard to motivate an objectively correct relative weight of these criteria. When is it acceptable to complicate the play, or to add material, in order to intensify the theme? In a tactical study, how much should stunning visual effects count as compared to availability of counterplay? Judges have different opinions on this, and so do composers when they compare versions. What are the facts that justify one particular tradeoff ratio as rational (apart from the consensus of strong composers, but this is not what we are looking for)?

In the light of such observations (and similar objections), it is very much an open question what kind of objectivity we can defend in science, and in study evaluation. Interested readers may want to look at an encyclopedia entry I wrote with Julian Reiss, specifically some parts of Section 3 and 4: https://plato.stanford.edu/entries/scientific-objectivity/

There is a further problem. In economics, there is the famous Arrow’s impossibility theorem about the impossibilty of aggregating preferences or votes in a way that satisfies certain adequacy conditions. (https://en.wikipedia.org/wiki/Arrow%27s_impossibility_theorem) Also Dobrescu mentions it in his well-known 1993 article in EG.

It has been shown by Samir Okasha, a philosopher of science at Bristol University, that this impossibility result also applies to the problem of aggregating rankings according to different criteria to a single judgment. That is, if our input is only on the ordinal scale such as “Study #1 performs better than #2 and #3 in terms of economy, study #2 is better than #4, which is again better than #1 and #3 in terms of content, etc.”, then there is no reasonable general algorithm for aggregating these criteria-specific rankings into an overall ranking. The paper is here: https://philpapers.org/rec/OKATCA.

The problem can be tackled using cardinal evaluations (i.e., numbers) instead of orders. But I just wanted to highlight that objectivity in study evaluation and the aggregation of various criteria into an overall ranking are very challenging topics with a deep conceptual and mathematical dimension.

Jan Sprenger
Jan Sprenger
2 лет назад

I have written a long reply on general theoretical problems in study evaluation, but for some reason, Sergiy needs to approve it. Meanwhile, quick remarks on No. 5-7:

No. 5. The introduction is at best so-so. (Exchange on e4, and nothing special happens.) The pointe Kd1 is a clever defense, but more impressive when it comes from White, like in Sarychev’s study. But the real problem is in the solution Bg4+. Two exclamation marks? Since White needs to play Bg4 anyway (the a4-d1 diagonal is not available), he should better play it immediately to restrict Black’s options. So White does not even have to know Sarychev’s study, or to calculate, in order to make the right decision. This undermines the logic of the study and leaves a disappointing feeling. I agree with the 1,5 points verdict. Actually, I might give even less. (You know that I like your studies in general, so nothing personal here!)

No. 6. Computer product. My main objection is that from a human point of view, the try 6. Sd5 and the solution 6. Sc4 are almost indistinguishable. In both cases, the pawn gets stopped on f3 and in one case, it is a win and in the other case a draw. Completely opaque to me. I agree that the play before is interesting and surprising.

No 7. I like this study. Typical Bazlov: clear, maximally economic and with good feeling for the visual component. Hiding in the corner is actually logical since the queen can now countercheck on the b-file and exploit the bad position of the black king. But the timing and the proof are of course far from trivial.

Of the three, I would have liked to see only this one in the album. Question: if you liked this study so much, why did it only get a special HM at your birthday tournament?

Jan Sprenger
Jan Sprenger
2 лет назад
Ответ на  Didukh

Thinking about this position a bit, it is actually clear why it is a draw. White cannot force the king from the corner without allowing f4-f3. In that case, I revise my assessment of No. 6 upwards. Still uncertain about FA because I don’t know the other malyutka studies that were submitted. But in any case, I like it better than Tkachenko’s study. Better intro, no technical pawns like the poor guy on d3, only thematic material, good thematic tries, two unblocking moves with the king.

Владислав Тарасюк
Владислав Тарасюк
2 лет назад
Ответ на  Jan Sprenger

Ян, в статье я привёл этюды No 5-7 в качестве этюдных примеров с одной пуантой, которые получили очень низкие баллы… Я мог выбрать другие работы. Не вижу здесь особой разницы… Почему я не должен говорить об этом публично? Можно ли решать эти вопросы только в личной переписке? Почему должен обижаться кто-то из судей? Почему, например, не обижается Перваков? Почему нам нельзя стать более ответственнее при оценивании работ в качестве судей? Ведь это касается не только Альбомов ФИДЕ, а и обычных турниров по составлению.

Да, на своём юбилее, я дал этюду No 7 – spec. hm. Два года назад я его не оценил сполна и не дал призовое отличие. Но неужели, полученное отличие на турнире должно влиять на оценку этюда при отборе в Альбом?!

Как судья, я ещё многому учусь и не могу быть уверен, что мои балльные оценки были идеальными. Но в статье я высказал своё мнение, и есть желание всем нам улучшить понимание этюда.

Jan Sprenger
Jan Sprenger
2 лет назад

Vladislav, I see your point about “one pointe studies”. But No. 6 does not really fit into this scheme imho.

No. 7: Of course you can (and should) correct your earlier judgment if you now look differently at the study! It was just a honest question and you have answered it satisfactorily.

Regarding the method, I have two observations:

1. Martin told me that you judges actually agreed about most studies. WIth almost 1000 studies, it is clear that there will be some cases where judges disagree. The article creates the impression that there is a substantial problem while (according to Martin) the judging mostly went smoothly and the judges discussed cases where you disagreed and tried to resolve them jointly.

It is also clear that with 1000 studies, there will necessarily be mistakes. One way to contain them is more judges, so that individual differences average out, but it will be hard to find people. But some inaccuracy is inevitable. My very superficial impression is that for the current FA, the error rate was reasonable. Question: for how many of the ca. 1000 studies did the judges reach a clearly wrong decision, in your view? (You know that statisticians are happy with a 5% error rate in hypothesis testing.)

2. Some mistakes are inevitable, I said. However, it would be less desirable would be if there is systematic bias against a particular type of study, You mention that malyutkas and subminiatures did not do well, and you also mentioned “typical album studies”.

These claims have to be substantiated, though. What you should then do, perhaps with the help of some volunteers, is to go through the submissions and to classify the studies according to material and character (e.g., Sergiys ABCD system). Then we have a data set (e.g., as an excel sheet) on which we can run statistical tests and see whether there is systematic bias against or for some type of study.

Yes, lots of work. Probably you don’t want to do this for the FA 2016-18. But I propose that judges do this (perhaps with some outside help) for the FA 2019-21. So FA judges don’t only give a numerical score, but they also classify the study according to a couple of main characteristics (e.g, number of pieces, tactical yes/no, logical yes/no, etc.).I guess Sergiy will tell us what the classification system should be.

Once we have such a dataset, we can talk about the selection process in a systematic and scientific way and do not have to rely on single cases. The discussion about individual studies is helpful to illustrate general points and perhaps to develop criteria, but it is not adequate for proving anything about the selection process. As you know as a medical doctor, the single case is always in some respect different from the statistical rule…

I can write a response to your article for “Problemist of Ukraine”, if you like, using my knowledge of statistical methodology, in order to present my thoughts in a more systematic and citable form.

Владислав Тарасюк
Владислав Тарасюк
2 лет назад
Ответ на  Jan Sprenger

Ян, конечно Вы можете написать ответ на мою статью, если нужно привести примеры и т.д. Нет проблем. Каждый имеет право на своё мнение.

Я вот ещё подумал, что ради эксперимента, можно попробывать в присуждении некоторых турниров, судье указывать после решения этюда его балльную оценку. Может это заставит судью быть более ответственным в своём решении и не раздавать, для начала, “лишние” призы!?

Yarrog
Yarrog
2 лет назад

А идея интересная. Только реакция (оценка) судьи будет предсказуема. Дал 1 приз – значит, 3 балла (как минимум), похвальный отзыв – 1 и меньше. И непонятно, как это поможет потом в отборе для Альбома, если судьи будут разные?

Перваков
Перваков
2 лет назад

К сожалению, я это заметил, многие арбитры, даже известные, падки на оценки из конкурсов. Особенно, если у чела много хороших призовых этюдов и что-то надо отсеять. Возьму свой пример. Ван Хейден присудил похвальный отзыв моему этюду из Кубка мира, который Сергей Дидух оценил как супер, да и я думал, что этюд достоин Альбома. Но… Интересно, отберут ли в очередной Альбом наш с Громовым этюд из ЮК Нильсена (похвальный отзыв), который, я считаю, один из лучших в последнее время на тему доминации, или посчитают, что судейство Нильсена – абсолют?

Владислав Тарасюк
Владислав Тарасюк
2 лет назад

Игорь, я тоже с тобой согласен, что этюд с 3-мя баллами – это призовой уровень. Часто судьи дают в конкурсе пять и более призов. Ещё чаще это неоправданно много. Если сложить призовые этюды всех турниров и конкурсов за год, то получится их количество около 150-200 этюдов. За три года цикла примерно 500-600. Из этих “призов” в Альбом их попадает значительно меньше.

Так, в последний АФ попал 191 призовой этюд, также вошло 27 работ с hm. и 10 этюдов с com. Кстати, куда смотрели судьи, которые присуждали похвальные отзывы в конкурсах – ведь это были, в итоге, альбомные этюды, некоторые из которых получили даже высокие 9 и 9,5 баллов?!

Уважаемые коллеги, вывод сделайте сами…