Владислав Тарасюк “Проблемист Украины” №1 2021.
В октябре прошлого года закончился отбор в этюдный раздел очередного Альбома ФИДЕ 2016–2018 (судьи Олег Перваков, Мартин Мински и Владислав Тарасюк). В отличие от моих коллег, это был мой первый судейский опыт на уровне Альбома. В отборе участвовало 919 этюдов-кандидатов. Количество отобранных работ – 227, что составило 24,7% от общего числа. В этот раз в Альбом попало намного больше этюдов, чем в предыдущих циклах: в 2010–2012 гг. было 122, а в 2013–2015 гг. ещё меньше – 107. Бытует мнение, что попадание в Альбом – это в некоторой степени лотерея…
Всего в отборе участвовало 113 авторов. Работы 52-х этюдистов получили прописку на страницах нового Альбома ФИДЕ. Это был действительно плодотворный период в творчестве многих коллег, особенно это можно сказать о призерах последнего чемпионата мира. По итогам этюдного раздела 2-й призер Martin Minski выполнил норму международного гроссмейстера, а 3-й призер Steffen S. Nielsen, как и автор этих строк, стали международными мастерами…
Лучшим этюдом в отборе стал №1, набравший в сумме у трёх судей Альбома максимальные 12 баллов!
И, всё-таки, с учётом многих отличных работ, попавших в Альбом, очень удивило совсем мизерное количество судейских 4-балльных оценок. Так, например, у M.Minski и М. van Herk (директора раздела) было по одной такой оценке, В.Тарасюка – четыре, а у О.Первакова, вообще, не оказалось этюдных оценок в 4 балла… А ведь были ещё шедевры! Например, следующие два этюда №2–3, которые, хоть и получили от трёх судей “всего лишь” 10 баллов, но стали одними из этюдных украшений нового Альбома ФИДЕ.Так, в этюде №2 автором представлена отличная реализация сложной и очень оригинальной идеи.
А вот в этюде №3 соавторы реализовали непростой фокус с одновременной поимкой двух ферзей … двумя конями! Этюды №2–3, из категории работ, которые не просто запоминаются, но и уникальны! Ведь осознать эти идеи – это одно дело, а заставить их работать – настоящее чудо! Подобные работы не так часто можно встретить в итогах конкурсов и судьи Альбома, руководствуясь каждый своими критериями оценки, явно недооценили их сполна. При этом неудивительно, что оценки к другим, «менее» привлекательным этюдам получили от судей достаточно высокие 3,0 и даже 3,5 балла. Можно ли, например, в один ряд с показанными выше работами поставить следующий этюд №4? Этому привлекательному, но, всё-таки, схематичному этюду один из судей дал 3,5 балла (неужели, только лишь за один ход ферзя 3.Qh8! в угол?), что очень помогло работе набрать 8 баллов и попасть в Альбом. Но ведь, сама жертва ферзя с угрозой сдвоения со слабейшей фигурой – слоном впереди (тема Лойда-Тертона) не очень впечатляет и чёрные, при этом, совсем не борются?!Замечу, что другим подобным этюдам с одним «ярким» ходом «повезло» намного меньше. Например, этюду № 5, в котором с переменой сторон, представлен оригинальный «рецепт» преодоления известной идеи знаменитого этюда братьев Сарычевых, тот же судья поставил 1,5 балла.
А вот два интересных и, по-своему, уникальных этюда №6–7 со строгой экономией сил и очень хорошей техникой. Жаль, но им не удалось набрать нужное количество баллов для попадания в Альбом. Опять сказались «слишком» строгие подходы судей к оценке этюдов?Среди всех этюдов-кандидатов, авторы представили 29 малюток. В новый Альбом попала лишь одна из них и то, благодаря последнему WCCI. Остальные, не были замечены судьями, получив, в основном, низкие оценки. В том числе, и эта, элегантная малютка №6 с классической техникой блокирования пешки двумя конями в линии Троицкого.
Дважды (2.Kf5!! и 5.Ke6!!) белый король парадоксально уходит из-под блокированной им чёрной пешки, ради удачной её задержки одним из коней в финале. Удивительная находка (её уникальность – в простоте и 5-ти (!) фигурах), которую положительно мог бы оценить и сам Алексей Троицкий. Уникальность этюда №7 – в очень экономной реализации идеи ухода короля в угол не из-под шаха. И это в непростом ферзевом (!) окончании при двух пешках. Примечательно, что в ложном следе чёрные спасаются маневром своего короля также в угол, но на противоположной части доски.Справедливости ради отмечу, что судьи, вместе с директором раздела, несмотря на разный стиль оценивания, всё же стремились определить лучшие работы в этюдном разделе. Была проведена большая работа по проверке на предшественников и корректность. Martin Minski для удобства работы судей создал PGN-файл всех поступивших этюдов. При этом он обратил внимание на необходимость изучения и PDF-файлов с авторскими комментариями. Директор раздела Marcel van Herсk по итогам общих судейских оценок подготовил отдельную таблицу с 84-мя этюдами, получивших предварительно 7,5 балла. Он предложил судьям дополнительно пересмотреть эти этюды и определиться, например, с оценкой в 2,5 балла – если бы конкретно отдельная работа заслуживала, по мнению у кого-то из судей, быть в Альбоме, то можно было ему поднимать свою оценку до 3,0 баллов или, наоборот, понижать до 2,0 баллов. Итогом непростых совместных дискуссий стало дополнительное попадание в Альбом ещё 45-ти этюдов разных авторов, в частности, Y.Afek, B.Djurasevic, M.Gonzalez, M.Hlinka, L.Kekely, J.Polasek, J.Timman, E.Vlasak, П.Арестов, П.Киряков, А.Сочнев, А.Ставриецкий и многих других.
Но судейский диалог иногда не был результативным, что, так или иначе, повлияло на отбор. Не хватало более открытой атмосферы взаимного общения, а также сказалось наличие у судей различных критериев оценки этюдов. С одной стороны, – это «нормально» (на вкус и цвет товарищей нет!), с другой – это проблема, которая сама по себе не нова. Вспомним, хотя бы недавний и показательный случай непопадания в Альбом ФИДЕ 2013-2015 этюда №7 (судьи Richard Becker, Martin Minski, Ladislav Salai).
Это полноценное сражение с великолепной игрой фигур обеих сторон не смогло набрать от трёх судей АФ 2013–2015 даже минимальные 7,5 баллов, которые были необходимы для попадания этюда в Альбом прошлого цикла.Какой можно сделать вывод на обозначенную тему – как попасть в Альбом ФИДЕ?
Считаю необходимым попытаться разработать критерии оценки шахматного этюда, перечислив конкретные позиции (достоинства и недостатки), и их официально утвердить. Это может и должно стать руководством для работы судей в следующих Альбомах. Согласен с Сергеем Дидухом, что «искусство оценивания этюда состоит в том, чтобы разглядеть за его скорлупой (начальной позицией и главным вариантом) его нутро (всё содержание) и выделить в нём главное и второстепенное. Второстепенное часто мешает главному, и это является источником основных проблем современного этюда». Также поддерживаю мнение Владимира Самило, который считает, что «одним из приоритетных критериев оценки этюда при отборе может быть уникальность выражения идеи».
В то же время, при этюдной комиссии WFCC на постоянной основе необходимо создать апелляционную комиссию или же совет старейшин, состоящий, например, из чемпионов мира прошлых лет, для рассмотрения спорных случаев при отборе в Альбом ФИДЕ. Такая процедура даст возможность авторам использовать право на защиту своих произведений, что может иметь решающее значение в вынесении справедливого окончательного решения. При этом, создание апелляционной комиссии должно поднять и ответственность самих судей, которые дают согласие работать не только в Альбомах ФИДЕ, а также и в официальных турнирах (Кубка мира и Олимпийского турнира).
Очень важно, чтобы и каждый автор этюда был более объективным и требовательным в оценке своих работ при их посылке в Альбом: зная принятые критерии оценки, автор мог бы прогнозировать результат. Тогда, возможно, не будет и значительного количества работ низкого качества, что наблюдалось в отборе этюдов к последнему Альбому ФИДЕ. Всё это в комплексе должно облегчить работу судьям по проверке и оценке этюдов, и, в конечном счёте, к более объективному качеству отбора.
Затронутые в статье вопросы, конечно же, непростые и требуют открытого обсуждения и соответствующей разработки.
Влад, статья неплохая. Но в отношении этюда Самило не согласен. Кроме Кf5 и Ке6, коим ты даёшь аж по два восклицательных (??), у белых вообще нет ходов. Или ты считаешь ходы конем под их стреноживание королем черных адекватными? Спроси у Кирякова – он бы их вообще в партии не рассматривал, так, Петр?
Олег, за белых ещё есть 6.Nc4! вместо 6.Nd5?
Любопытно, что до Самило никто ранее не додумался, дважды “отпускать” уже заблокированую пешку королём, а потом её задерживать одним из коней. Конечно, это просто, но это всё в малютке!..
А в многочисленных этюдных примерах пешка, в таких случаях, просто убегала и чёрный король получал всевозможные маты, что сейчас уже трудно этим кого-то удивить.
Да, и ещё есть такое понятие как альбомный этюд… Должен ли он быть обязательно мощным и масштабным?!
Олег! По поводу твоего с Михаилом (№1). У меня есть серьёзные сомнения в отношении его корректности: 7.Qc8+ Qe6 (7…e6 8.Rf2 – поз.1) 8.Qc5+Kf6 (8…Kxf4 9.Qc1+ +/-) 9.Be5+ Kf7 10.Rf2+ – поз.2. В поз.1 и поз.2 у белых лишний слон. Как правило, в таких ситуациях сильнейшая сторона побеждает! 8-фигурные базы появятся лет через 10, а для ручного анализа поз. 1 и поз. 2 понадобится 500 лет! Выбирай: жди базы или анализируй вручную!
Валера, во первых, ход 7…е6 быстро проигрывает, а вот после 7…Qe6…10…Kg8 черные достаточно быстро вынуждают белых разменять ферзя или ладью, слишком плох белый король.
Влад, не уверен, извини… Но этюд не для Альбома. Спроси Серёгу Ткаченко, он авторитет для меня в этом материале
Олег, в целом, этюды прошлого цикла – это уже история… Я думаю, всё-таки, нужно попытаться вместе разобраться с критериями оценки. Указать, что такое достоинства и недостатки в этюдах, и учитывать это судьям при своей работе. В любом случае, это должно быть всем нам на пользу, а особенно, самому Этюду.
Владислав, я не этюдист, но имею опыт судейства коопматов – 3 раза. Разобраться с критериями – это утопия. Увы. У вас все нормально, по сравнению с нами, вы хоть отобрали много.
Ну, могу сформулировать свои общие рекомендации:
1. Ищите в этюде идею. Настоящую идею в единственном числе, а не добавки к ней в разных вариантах. Идеи имеют критерии, по которым их можно сравнивать между собой: к-во необходимых ходов, вариантов и фигур для ее воплощения, парадоксальность, трудность реализации, оригинальность.
2. Забудьте о своих симпатиях или антипатиях к автору этюда.
3. Изучайте этюды внимательнее. Не только свои …
Сергей, согласен с тобой. Помимо критериев, очень важно забыть о симпатиях и антипатиях к авторам этюдам.
пункты 2 и 3 сомнения не вызывают. А пункт 1… В последнем альбоме я дал задаче Петкова 4 балла. Это одна из лучших задач за последние 10 лет в h#2, которую я видел. Мог дать и 3,5, но подстраховался и дал именно 4. И что же? Два других подельника дали по 2(!!!) балла. Что они там не поняли или к чему придрались, я не знаю, но если бы не моя оценка – задачи в альбоме бы не было! Это меня так поразило и разозлило, что я больше не хочу тратить свое время на это мероприятие. Я пять раз просматривал задачи 2,5 и выше, а они взяли и чуть не зарезали….
Пункт 1 самый трудный. Его нужно объяснять с глазу на глаз долго и нудно, чтобы не было кривотолков и собеседник понял все так, как надо.
Валерий, если и дальше не разбираться с критериями, то тогда точно будет утопия… Ведь не каждый может ставить 4 балла и “спасать” 😎 работу, как делал ты в разделе кооперативных задач.
Увы, не достачно спасал, надо было 4 балла ставить налево и направо. И ведь подельники то не желторотые, а известные и уважаемые люди 🙂 А ты про критерии тут говоришь….
Валерий, если не говорить об этом, то тогда всё останется на прежнем месте. А это тоже не правильно, например, завышать баллы одному судье для подстраховки от слишком других строгих судей.
Кстати, была попытка директора раздела кооперативных задач, где ты был судьёй, прокомментировать судьям свои разные баллы к некоторым задачам? Я имею ввиду разнобой баллов, например 4 + 2 + 2. Или задача прошла в Альбом и пусть так остаётся?
Я сразу написал директору, что офигеваю от такого судейства и привел в пример именно эту задачу. Так что попытки не было 🙂 Там же пытаются урезонить арбитра, который именно выделяется своей оценкой – а это был я :-)) Но я и в первом своем судействе так делал – когда протащил миниатюру Степочкина, понимая, что могут зарезать. Но там я явно балл, а то и полтора, добавил, а здесь у меня просто нет слов. Но подождем, что Петков скажет, когда это увидит 🙂
Владислав, ты ужасно переоцениваешь этюды № 5-7.
В № 6 ты придумал какую-то идею “дважды отпускать черную пешку”. А как еще выручать стреноженных коней? Идея именно в стреноженных конях, и ее уже реализовывал С.Н.Ткаченко по подсказке А.Кузнецова: “А попробуй составить этюд, где из ряда позиций коневой подстраховки к победе ведет единственная расстановка лошадок!” (“Откровения шахматного странника” с.196)
В этюде Ткаченко уход двух ладей и коня – всё-таки большая цена для реализации несложной идеи. Не экономно. Интересно эта работа попала в Aльбом?!
Что касается части игры после 7-го хода белых (малютка):
1. В конце ложного следа чёрному королю необязательно близко стреноживать коней – вместо 7…Kf6 достаточно и 7…Ke6 с последующим 8…d5
2. А вот дуалька 10. Ke3(e4) и ещё другая дуаль 13.Ne4+ на последнем ходу решения смазывают восприятие финальной игры и снижают впечатление… У Самило везде всё чисто – в решении и ложных попытках.
Чисто и пусто. Ну, это же идея на 2 балла максимум при идеальной реализации.
Владислав, ты точно забыл про симпатии к своему тренеру Самило? А то я вижу твои попытки запудрить всем мозги “парадоксальной” идеей в ходах короля и формой малютки – вовсе не достижение, так как идеи с линией Троицкого почти всегда малютки.
The other day I showed a chess friend Costeff’s study with a caged rook (2nd special prize of Krug-50). He was amazed that I rate such a “funny gimmick” so highly. What do I mean by that? There is no such thing as an objective truth. Every judge may see it a little differently. The most difficult problem is how to evaluate (partial) anticipation. The question is what kind of personal contribution and improvement can be recognized in a study “according to Sarychev”, for example. That is still difficult for me (and certainly other judges). When in doubt, I ask expert colleagues to objectify my judge’s decision.
Some here demand that one should not decide based on sympathy for the composer. That goes without saying for me and certainly for every judge.
Colleague Tarasiuk should note that he did not “buy” the absolute truth either. Everything he writes in his article is his personal opinion. If he doesn’t want to see a study by Costeff (Turton with Qh8 !!) in the album, then he has to give the appropriate points and not “Maybe”.
A baby (5 pieces) that is perfect doesn’t have to be in the album. There is no automatism.
As a FIDE judge, I take notes on every study. I write down the advantages and disadvantages. In the end, I have to feel that this study belongs on the album. Any study that I rate highly has to appeal to me emotionally, regardless of style or author.
The 3 independent judge system has its weaknesses. There are always tragic decisions, like the study by Oleg from Tata Steel. I gave it 3 points at the time and thought that with 9 points this study would be safe in the album. It turned out differently because one judge was against (for whatever reason) and another judge was unsure.
There are always small and (sometimes perhaps large) injustices. Nevertheless, I consider the judging system to be overall successful. Our director Marcel van Herck confirmed that all three judges, with a few exceptions, had a very high degree of agreement.
As a composer or as a judge, I have always accepted that other judges may have different opinions about my studies. I am not subjecting any other judge to bad intentions. Therefore, it would never occur to me to write an article complaining about a single study that I find undervalued.
I do not consider another committee with possible complaints afterwards to be practicable. I think the FIDE Album Commission is happy to have three judges and a director for each section who volunteer so much work. In our small society there are no more staff.
Yes, yes, Oleg, I’m conservative and don’t want to change anything. 🙂
Мартин, я написал статью не с жалобой на один этюд. Ты не прав – читай внимательнее. Одна из моих целей в статье – уменьшить трагические ошибки непопадания в Альбом достойных этюдов. Если бы ты, например, дал тогда этюду Первакова из Tata Steel не 3, а 3,5 балла, как и этюду Costeff с ходом Qh8!, то он тоже был бы в Альбоме. Разве этюд Олега был хуже!?
И я считаю неправильным, когда “судьба” попадания в Альбом зависит от одного судьи, давшего очень высокий балл на фоне низких баллов двух других судей (например 2 и 2,5 балла). Здесь либо один судья заблуждается, либо остальные двое судей правы, что этюду не место в AF. В этом случае нужен результативный диалог судей, желание слышать друг друга в своих аргументах, что не хватало нам в отборе к последнему Альбому. Этому нельзя научиться сразу за один месяц или год, но мы должны учиться и стремиться меньше ошибаться при оценивании этюдов. Без общепринятых рекомендаций с критериями оценивания этюдов, проблема будет оставаться и дальше нерешённой.
Не думаю, что аппеляционная комиссия не нужна. В том же случае с этюдом из Tata Steel, Олег или возможно другой автор мог бы обратиться в комиссию и имел шанс на более справедливое решение. Почему авторы не должны иметь на это право? Также они имеют право и на открытую публикацию баллов не только ко всем этюдам, но и задачам, полученных при отборах в Альбомы. Тогда и судьи будут ответственнее при оценивании работ и, возможно, меньше станет “друзей” друг у друга.
Vladislav, maybe you are wrong too.
The whole way you act is presumptuous.
You want to explain to me that I should give a study 0.5 points more or less.
Who are you ?
I’m not starting to think about your reviews and I still know where up and down is.
Мартин, я также ошибаюсь, как и все. И я могу заблуждаться. Но мы должны вместе все учиться и меньше ошибаться. Или дальше делать вид, что у нас в этюдах всё хорошо, раздавать призы и красиво улыбаться…
Vladislav, the difference between us is that I am not writing an article and indirectly claiming that my fellow judges made mistakes.
There is at least one study of yours with 6 pieces that goes into the album. So the other judges are not fundamentally against studies from the database. But you present other studies, including one of yours that does not make it into the album, and complain.
I’m just mirroring your behavior.
You want objective criteria. If it were that easy …
If you can find a formula for it, then we no longer need a person as a judge. Then the computer can figure it out. I don’t think there will ever be, because studies evoke emotions that only humans can feel.
I think that Costeff’s study with Turton and Dh8 should be on the album!
Now I learn from your article that I made a “mistake”. What’s all this about ?
You propose a committee to avoid these “mistakes”.
Should there ever be such a committee I’m no longer a FIDE album judge.
Мартин, я не писал в статье, что ты ошибься. Читай внимательнее…
Ты дал этюду Costeff с Qh8! дал 3,5 балла. Разве за один ход дают такую высокую оценку!? Почему ты тогда не ставил такие оценки другим этюдам с одной пуантой? Повторюсь, разве можно сравнить Turton с этюдом Gady из P.Krug-50 JT ?
Vladislav, yes, I think my ratings for Costeff’s studies are appropriate.
I can also ask you why you rate both studies so differently. But I don’t do that, at least not in a public article!
There is a good reason why ratings of the FIDE album should not be publicly available in order to avoid endless discussions.
You broke this rule.
You don’t say my name directly, but you know that I read this.
Why don’t you ask me in a personal email why I gave this or that rating?
You probably see yourself as the savior of the FIDE album.
Sergiy told you how to rate the failed studies you showed.
You don’t even believe him.
Did your chess friend “objectify” your evaluation of Gady’s gimmick? Why do you ask his opinion if he doesn’t know much about composition? Your actions are very strange.
There’s an objective truth but people can’t discover it here on Earth. Still, they can get closer to it or further. And Vladislav or me don’t have to put “to my mind” or “I think” in every our sentence so that you or your very clever friends could see that its our personal opinions. It will always be our personal opinions.
My chess friend is Jan Sprenger.
I showed him Costeff’s study yesterday.
Tarasiuk evaluates the other judges. That’s strange.
An expert who hasn’t seen Gady’s study before! What a strong expert!
Tarasiuk or any other person has the right to evaluate you or any other judge. What’s the problem? You don’t like it?
Sergiy, I am the first to admit that I need to study the history of the endgame study better. This is because I started composing recently. But I do not think that the fact that I did not know Costeff’s study before disqualifies my judgment. The judgment should be evaluated in the light of the provided reasoning. And when I try to fill the gaps in my knowledge, I prefer to focus on Troitzky, Mattison, Kasparyan, Kazantsev, Liburkin, and some more modern classics like Kralin and Ryabinin. Not on the most recent stuff (this is not intended as a quality judgment). Same in music conservatory. For example, you learn the principles of counterpoint with an analysis of Bach’s fugues and not with Schönberg’s “Verklärte Nacht” (even though I like that piece a lot!).
Coming to Costeff’s study. I admire Gady’s technical skill. It looks almost like a miracle to me to have implemented this theme. Nonetheless, I said “Spielerei”. This is more abstract than the english “gimmick” and perhaps closer to the Russian “tryuk”. Spiel, “play”, is in it, but not in the slightly pejorative sense of “gimmick” and “gadget”. Why couldn’t I take the study fully seriously? Because first of all, a study should be an endgame study. Not unlike Timman’s and your study in UAPA-13, this work looks a bit like a problem dressing up as a study.
Of course this is a very good composition. But 10,5 is a very rare score in evaluations. This should (according to my conservative, classicist criteria) be reserved for studies which—apart from intensity of content, orgininality, etc.—satisfy a high degree of elegance, openness and naturalness. Ideally also more counterplay (in this kind of tactical studies) and no humanly unclear sideline like the 6. …c4 line. That’s why I was surprised when Martin told me the score. (“10,5 Punkte??? Für diese Spielerei?”)
There are, in my view, way more significant studies in the classical or logical style that finish with something between 8 and 10 points. I have, like Vladislav, also the impression that studies in the 5-8 piece range have a harder time with some judges, all other things being equal. (This observation is not about the FA because I did not study the scores closely.) But even an otherwise incompetent judge will see that there is something special about Costeff’s study while he may miss out on studies where the content is more hidden.
I would probably have included Costeff’s study in the album, too, because it is a significant technical achievement and, as far as I know, an original theme in the study domain. One should always be open to other approaches to composition or at least make an effort. But I think there is more that distinguishes an endgame study from a direct mate problem than the stipulation.
You have built Vatican inside Rome territory. You like its state of affairs and claim that everything beyond Vatican’s frontiers is not real Rome.
Frontiers of chess studies are determined by rules of chess and artistic principles, not someone’s preferences or beliefs. You can limit the study territory to a doghouse if you like. Maybe you’ll even succeed to persuade some puppies to stay inside, use only 10 pieces, and realize only a limited set of ideas. Gurvich did. His propaganda is still interesting to read. There will always be his followers who praise economy even though they don’t know what its true meaning is.
I like Gurvich’s propaganda and I do think I have a grasp of economy. But I also like the comparison with the Vatican. 😉
Probably the better comparison is again from music. Take 19th century music. You have those who search radically new forms, like Berlioz and Liszt with program music and symphonic poems, or Wagner with the music drama. And you have those like Mendelssohn and Brahms who follow the aesthetic ideals of Mozart and Beethoven, but give a very personal and unique note to them.
I think both paths are legitimate. I am definitely in the second camp. But it may from time to time be interesting to visit a concert with music from the first group.
(By the way, it is Gurvich who justifies his propaganda with universal aesthetic principles!)
Sergiy, yesterday I wrote two longer posts here responding to Vladislav but they were “pending approval”. I still don’t see them. Could you approve them? Or shall I repost? Thank you.
Мартин, ты противоречишь сам себе, Костеффу можно, а Жукову нельзя…
Ilham, unfortunately, I don’t understand the comparison with Zhukov. Can you explain your remark to me in more detail?
I only have one idea: You might think that I regard Costeff’s study with Qh8 as a “one move study” (according to your videos, which I still think are good, by the way). That’s not true. It’s a wonderful implementation by Turton in a study (very rare) with the point Qh8 (I only called it that because it’s convenient). I think this study belongs on the FIDE album. Do I have to be ashamed of it? I ask the other readers.
Я не говорил, что этюд Костеффа плох. Просто 3,5 слишком много.
I accept your opinion. Maybe my rating was a little too high.
A question to you: Should the study be in the album? Yes or no?
Xотя, к одному этюду у меня большие претензии. Я вам напишу на e-mail
Indeed, that’s presumptuous. Vladislav thinks that Costeff’s Turton study does not belong in the album. But the other judges see it differently. He presents his opinion as absolute truth. I find the whole article absurd and embarrassing.
Мартин, даже если твои оценки к этюдам были по-твоему адекватными, они всё равно должны оставлять за собой сомнения. Никогда не будь уверенным, что ты поступил правильно. Нужно иногда сомневаться и анализировать – это предварительное условие, необходимое до начала осмысленных действий.
Я еще не получил № журнала.
Влад, статья хорошая, и написана отлично. Но я не верю в изменения.
3 судьи – 3 разные мнения. Потому что у каждого свой вкус.
Насчет этюдов мне трудно судить, хотя могут быть личные предпочтения у судьи, как-то: классическая/романтическая форма, идеальный конец и т.д. и т.п. Я больше разбираюсь в задачах, и даже когда-то судил многоходовый раздел Альбома Украины. В задачах еще больше разных направлений: логические, ново-стратегические, “чешские”. Судить Альбом может (должен) тот судья, который работает во всех направлениях! Мне кажется, в этом “зарыта собака”, то есть скрыта истина. Судья – универсал! (Примеры – не идеальные, но все же: В.Руденко, Я.Владимиров, Ю.Гордиан). Но вот таких последнее время остается все меньше. И я не думаю, что ближайшее время найдется универсальный способ оценки отбора задач и этюдов в Альбомы.
Vladislav, I think you are right that it is important to reflect on criteria, things that do not go well, etc. I am a bit less sure that a public discussion of the judging process for one particular FA from the point of view of an insider is the right way to start this discussion. I think this is what annoyed Martin. But anyway. Let’s talk about the general problem, which is interesting.
Preliminary remark: I am a researcher in philosophy of science and so I am inclined to think that the problem of judging chess studies is somewhat similar to the problem of comparing scientific theories, or of comparing artworks. I think both science and chess composition are characterized (here I follow a classical text by Thomas S. Kuhn from 1977: https://www.andrew.cmu.edu/user/kk3n/philsciclass/kuhn.pdf)
—the presence of generally shared criteria for evaluation (for scientific theories, some of the most common are logical consistency, predictive accuracy, explanatory power, coherence with other theories, simplicity, etc.)
—the fact that various people assign a different relative weight to these criteria, creating dissent in spite of the fact that we have a shared set of criteria.
For example, I find it more important than some composers and judges that a study is not too heavily analytic. Others may be inclined to accept more analytic lines if this contributes to economy or intensity of expression.
This has the consequence that it is hard to motivate an objectively correct relative weight of these criteria. When is it acceptable to complicate the play, or to add material, in order to intensify the theme? In a tactical study, how much should stunning visual effects count as compared to availability of counterplay? Judges have different opinions on this, and so do composers when they compare versions. What are the facts that justify one particular tradeoff ratio as rational (apart from the consensus of strong composers, but this is not what we are looking for)?
In the light of such observations (and similar objections), it is very much an open question what kind of objectivity we can defend in science, and in study evaluation. Interested readers may want to look at an encyclopedia entry I wrote with Julian Reiss, specifically some parts of Section 3 and 4: https://plato.stanford.edu/entries/scientific-objectivity/
There is a further problem. In economics, there is the famous Arrow’s impossibility theorem about the impossibilty of aggregating preferences or votes in a way that satisfies certain adequacy conditions. (https://en.wikipedia.org/wiki/Arrow%27s_impossibility_theorem) Also Dobrescu mentions it in his well-known 1993 article in EG.
It has been shown by Samir Okasha, a philosopher of science at Bristol University, that this impossibility result also applies to the problem of aggregating rankings according to different criteria to a single judgment. That is, if our input is only on the ordinal scale such as “Study #1 performs better than #2 and #3 in terms of economy, study #2 is better than #4, which is again better than #1 and #3 in terms of content, etc.”, then there is no reasonable general algorithm for aggregating these criteria-specific rankings into an overall ranking. The paper is here: https://philpapers.org/rec/OKATCA.
The problem can be tackled using cardinal evaluations (i.e., numbers) instead of orders. But I just wanted to highlight that objectivity in study evaluation and the aggregation of various criteria into an overall ranking are very challenging topics with a deep conceptual and mathematical dimension.
I have written a long reply on general theoretical problems in study evaluation, but for some reason, Sergiy needs to approve it. Meanwhile, quick remarks on No. 5-7:
No. 5. The introduction is at best so-so. (Exchange on e4, and nothing special happens.) The pointe Kd1 is a clever defense, but more impressive when it comes from White, like in Sarychev’s study. But the real problem is in the solution Bg4+. Two exclamation marks? Since White needs to play Bg4 anyway (the a4-d1 diagonal is not available), he should better play it immediately to restrict Black’s options. So White does not even have to know Sarychev’s study, or to calculate, in order to make the right decision. This undermines the logic of the study and leaves a disappointing feeling. I agree with the 1,5 points verdict. Actually, I might give even less. (You know that I like your studies in general, so nothing personal here!)
No. 6. Computer product. My main objection is that from a human point of view, the try 6. Sd5 and the solution 6. Sc4 are almost indistinguishable. In both cases, the pawn gets stopped on f3 and in one case, it is a win and in the other case a draw. Completely opaque to me. I agree that the play before is interesting and surprising.
No 7. I like this study. Typical Bazlov: clear, maximally economic and with good feeling for the visual component. Hiding in the corner is actually logical since the queen can now countercheck on the b-file and exploit the bad position of the black king. But the timing and the proof are of course far from trivial.
Of the three, I would have liked to see only this one in the album. Question: if you liked this study so much, why did it only get a special HM at your birthday tournament?
You used another e-mail, so the system identified you as a new person and I had to approve his first post.
No 6. Theory says that it’s a draw with pf4 if the king reaches the corner h1. Many studies were composed on this rule.
Thinking about this position a bit, it is actually clear why it is a draw. White cannot force the king from the corner without allowing f4-f3. In that case, I revise my assessment of No. 6 upwards. Still uncertain about FA because I don’t know the other malyutka studies that were submitted. But in any case, I like it better than Tkachenko’s study. Better intro, no technical pawns like the poor guy on d3, only thematic material, good thematic tries, two unblocking moves with the king.
Ян, в статье я привёл этюды No 5-7 в качестве этюдных примеров с одной пуантой, которые получили очень низкие баллы… Я мог выбрать другие работы. Не вижу здесь особой разницы… Почему я не должен говорить об этом публично? Можно ли решать эти вопросы только в личной переписке? Почему должен обижаться кто-то из судей? Почему, например, не обижается Перваков? Почему нам нельзя стать более ответственнее при оценивании работ в качестве судей? Ведь это касается не только Альбомов ФИДЕ, а и обычных турниров по составлению.
Да, на своём юбилее, я дал этюду No 7 – spec. hm. Два года назад я его не оценил сполна и не дал призовое отличие. Но неужели, полученное отличие на турнире должно влиять на оценку этюда при отборе в Альбом?!
Как судья, я ещё многому учусь и не могу быть уверен, что мои балльные оценки были идеальными. Но в статье я высказал своё мнение, и есть желание всем нам улучшить понимание этюда.
Vladislav, I see your point about “one pointe studies”. But No. 6 does not really fit into this scheme imho.
No. 7: Of course you can (and should) correct your earlier judgment if you now look differently at the study! It was just a honest question and you have answered it satisfactorily.
Regarding the method, I have two observations:
1. Martin told me that you judges actually agreed about most studies. WIth almost 1000 studies, it is clear that there will be some cases where judges disagree. The article creates the impression that there is a substantial problem while (according to Martin) the judging mostly went smoothly and the judges discussed cases where you disagreed and tried to resolve them jointly.
It is also clear that with 1000 studies, there will necessarily be mistakes. One way to contain them is more judges, so that individual differences average out, but it will be hard to find people. But some inaccuracy is inevitable. My very superficial impression is that for the current FA, the error rate was reasonable. Question: for how many of the ca. 1000 studies did the judges reach a clearly wrong decision, in your view? (You know that statisticians are happy with a 5% error rate in hypothesis testing.)
2. Some mistakes are inevitable, I said. However, it would be less desirable would be if there is systematic bias against a particular type of study, You mention that malyutkas and subminiatures did not do well, and you also mentioned “typical album studies”.
These claims have to be substantiated, though. What you should then do, perhaps with the help of some volunteers, is to go through the submissions and to classify the studies according to material and character (e.g., Sergiys ABCD system). Then we have a data set (e.g., as an excel sheet) on which we can run statistical tests and see whether there is systematic bias against or for some type of study.
Yes, lots of work. Probably you don’t want to do this for the FA 2016-18. But I propose that judges do this (perhaps with some outside help) for the FA 2019-21. So FA judges don’t only give a numerical score, but they also classify the study according to a couple of main characteristics (e.g, number of pieces, tactical yes/no, logical yes/no, etc.).I guess Sergiy will tell us what the classification system should be.
Once we have such a dataset, we can talk about the selection process in a systematic and scientific way and do not have to rely on single cases. The discussion about individual studies is helpful to illustrate general points and perhaps to develop criteria, but it is not adequate for proving anything about the selection process. As you know as a medical doctor, the single case is always in some respect different from the statistical rule…
I can write a response to your article for “Problemist of Ukraine”, if you like, using my knowledge of statistical methodology, in order to present my thoughts in a more systematic and citable form.
Ян, конечно Вы можете написать ответ на мою статью, если нужно привести примеры и т.д. Нет проблем. Каждый имеет право на своё мнение.
Я вот ещё подумал, что ради эксперимента, можно попробывать в присуждении некоторых турниров, судье указывать после решения этюда его балльную оценку. Может это заставит судью быть более ответственным в своём решении и не раздавать, для начала, “лишние” призы!?
А идея интересная. Только реакция (оценка) судьи будет предсказуема. Дал 1 приз – значит, 3 балла (как минимум), похвальный отзыв – 1 и меньше. И непонятно, как это поможет потом в отборе для Альбома, если судьи будут разные?
К сожалению, я это заметил, многие арбитры, даже известные, падки на оценки из конкурсов. Особенно, если у чела много хороших призовых этюдов и что-то надо отсеять. Возьму свой пример. Ван Хейден присудил похвальный отзыв моему этюду из Кубка мира, который Сергей Дидух оценил как супер, да и я думал, что этюд достоин Альбома. Но… Интересно, отберут ли в очередной Альбом наш с Громовым этюд из ЮК Нильсена (похвальный отзыв), который, я считаю, один из лучших в последнее время на тему доминации, или посчитают, что судейство Нильсена – абсолют?
Игорь, я тоже с тобой согласен, что этюд с 3-мя баллами – это призовой уровень. Часто судьи дают в конкурсе пять и более призов. Ещё чаще это неоправданно много. Если сложить призовые этюды всех турниров и конкурсов за год, то получится их количество около 150-200 этюдов. За три года цикла примерно 500-600. Из этих “призов” в Альбом их попадает значительно меньше.
Так, в последний АФ попал 191 призовой этюд, также вошло 27 работ с hm. и 10 этюдов с com. Кстати, куда смотрели судьи, которые присуждали похвальные отзывы в конкурсах – ведь это были, в итоге, альбомные этюды, некоторые из которых получили даже высокие 9 и 9,5 баллов?!
Уважаемые коллеги, вывод сделайте сами…