Ложка дегтя в бочке хайпа.
Ресерчеры их Яббла выпустили пейпер, в котором показывают, насколько падает accuracy даже самых мощных моделей при усложнении задаваемых логических задач. Даже если модели дать четкий алгоритм действий.

https://ml-site.cdn-apple.com/papers...f-thinking.pdf