Сунъий интеллект ақл назарияси тестларида одамлардан устун келди

    Aқл назарияси тестлари инсоннинг оғзаки бўлмаган сигналларни таҳлил қила олиши, ўзини бошқа бировнинг ўрнига қўйиши ва дунёни бошқа нуқтаи назардан тасаввур қила олишини текширади.

    Тадқиқотчилар 1907 нафар кўнгиллининг маълумотларини таҳлил қилдилар, улар ақлнинг стандарт назарияси тестларини ўтказдилар ва уларнинг натижаларини "Llama 2-70b" ва "GPT-4" каби йирик лингвистик моделлар натижалари билан таққосладилар.

    Иккала гуруҳ ҳам бешта турдаги саволларга жавоб беришди, уларнинг ҳар бири тасодифий хатолар, киноя ёки баёнотнинг тўғрилигини баҳолаш учун мўлжалланган. Шунингдек, улардан "ёлғон эътиқодлар ҳақидаги саволларга жавоб бериш сўралган."

    Катта лингвистик моделлар одатда одамлардек, баъзан яхшироқ бўлган саволларга жавоб беришди. "GPT-4" барча турдаги саволлар бўйича энг яхши натижаларни кўрсатди.

    No date selected
    декабр, 2024
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    Use cursor keys to navigate calendar dates