Badanie Harvard–Stanford jasno wskazuje na zmianę układu sił w diagnostyce. Kiedy w 1959 r. pojawiła się pierwsza propozycja, aby ocenić medyczne systemy komputerowe na tych samych złożonych danych, z którymi mierzą się lekarze, sztuczna inteligencja była ledwie ciekawostką. Obecnie ta sama poprzeczka stała się dla dużych modeli językowych (LLM), takich jak ChatGPT, po prostu zbyt niska. Niezależnie od testów, algorytmy AI osiągają dziś lepsze wyniki niż setki certyfikowanych internistów.