Νέα έρευνα της Bryq αξιολόγησε το ChatGPT, Claude και Gemini απέναντι σε 10.000 πραγματικούς υποψηφίους για θέση Marketing Executive και κατέληξε ότι οι διαφορές ανάμεσα σε αυτά τα κορυφαία μοντέλα ΑΙ είναι πολύ μεγαλύτερες και πολύ πιο ουσιαστικές, απ’ όσο δείχνουν τα δημόσια benchmarks