ຂໍ້ມູນທີ່ກ່ຽວຂ້ອງ

ສູງຂຶ້ນ

ສະຖາບັນຄວາມປອດໄພທາງປັນຍາປະດິດແລະອັງກິດປະເມີນຮ່ວມກັນປະເມີນຮູບແບບລ້າສຸດຂອງ OpenaAI o1
ສຳລັບຜູ້ຊ່ວຍເຫລືອນ:2025-01-28 Source: Qingqiao ໂຕເລກລຸ້ນ:

ດ້ວຍການພັດທະນາຢ່າງໄວວາຂອງເຕັກໂນໂລຢີປັນຍາປະດິດ,OpenAIຮູບແບບລ້າສຸດo1ສະແດງປະສິດທິພາບທີ່ເຂັ້ມແຂງໃນຫຼາຍຂົງເຂດ. ເພື່ອຮັບປະກັນຄວາມປອດໄພແລະຄວາມ ຫນ້າ ເຊື່ອຖືຂອງຮູບແບບກ່ອນການຈັດຕັ້ງໃຊ້,ບໍ່ດົນມານີ້,ສະຖາບັນຄວາມປອດໄພທາງປັນຍາປະດິດຂອງສະຫະລັດ ແລະ ອັງກິດUS AISIແລະUK AISI ) ຮ່ວມມືກັນເຮັດໃຫ້ມັນລະອຽດການປະເມີນຮ່ວມກັນ.

ການປະເມີນນີ້ຖືກອອກແບບການທົບທວນຢ່າງເຕັມທີ່o1ການປະຕິບັດຂອງຮູບແບບໃນສາມຂົງເຂດຫຼັກຂອງຄວາມສາມາດໃນເຄືອຂ່າຍ, ຄວາມສາມາດທາງຊີວະພາບແລະການພັດທະນາຊອບແວແລະປັນຍາ ຄວາມສາມາດໃນເຄືອຂ່າຍຕົ້ນຕໍປະເມີນການປະຕິບັດງານຂອງຮູບແບບໃນຂົງເຂດຄວາມປອດໄພທາງເຄືອຂ່າຍລວມທັງຄວາມສາມາດໃນການປ້ອງກັນການໂຈມຕີທາງເຄືອຂ່າຍ ຄວາມສາມາດທາງຊີວະພາບແມ່ນກວດສອບຄວາມເປັນໄປໄດ້ໃນການນໍາໃຊ້ຮູບແບບໃນຂົງເຂດວິທະຍາສາດຊີວະພາບ, ເຊັ່ນ: ການປະມວນຜົນຂໍ້ມູນຊີວະ ການພັດທະນາຊອບແວແລະ AIສ່ວນໃຫຍ່ແມ່ນການປະເມີນແບບໃນນີ້ປະສິດທິພາບຂອງຂົງເຂດ, ລວມທັງຄວາມສາມາດໃນການສ້າງລະຫັດ, ການປັບປຸງ algorithm, ການຝຶກອົບຮົມຮູບແບບແລະອື່ນໆ.

640 (5).png

ໃນລະຫວ່າງຂະບວນການປະເມີນຜູ້ຄົ້ນຄວ້າໄດ້ຮັບການນໍາໃຊ້ວິທີການແລະເຄື່ອງມືຕ່າງໆo1ຮູບແບບໄດ້ຖືກທົດສອບຢ່າງເຕັມທີ່. ພວກເຂົາຈະo1ປະສິດທິພາບຂອງຮູບແບບແລະOpenAIຂອງo1-previewGPT-4oແລະAnthropicຂອງClaude 3.5 Sonnetຮູບແບບອ້າງອີງເຊັ່ນ: ລຸ້ນຍົກລະດັບແລະລຸ້ນກ່ອນໄດ້ຖືກປຽບທຽບ.ເພື່ອຮັບປະກັນວ່າຜົນໄດ້ຮັບການປະເມີນທີ່ສົມບູນແລະມີວັດຖຸປະສົງຫຼາຍຂຶ້ນ.

ອີງໃສ່US AISIຜົນການປະເມີນຜົນ,o1ຮູບແບບສາມາດແກ້ໄຂເຖິງ45%ວຽກງານ, ອັດຕາສ່ວນນີ້ເກີນຜູ້ປະຕິບັດທີ່ດີທີ່ສຸດໃນຮູບແບບອ້າງອີງທັງຫມົດ,ນອກຈາກນັ້ນ,o1ຮູບແບບສາມາດແກ້ໄຂສິ່ງທ້າທາຍທັງ ຫມົດ ທີ່ແກ້ໄຂໂດຍຮູບແບບອ້າງອີງໃດໆ ແລະແກ້ໄຂສິ່ງທ້າທາຍທີ່ກ່ຽວຂ້ອງກັບ cryptographyເຖິງຢ່າງໃດກໍ່ຕາມ,UK AISIຜົນການປະເມີນແມ່ນສະແດງພາບທີ່ແຕກຕ່າງກັນ. ພວກເຂົາໄດ້ພົບເຫັນໃນລະດັບເລີ່ມຕົ້ນຄວາມປອດໄພຂອງເຄືອຂ່າຍພາລະກິດ,o1ການແກ້ໄຂຂອງຮູບແບບແມ່ນ36%ຕ່ໍາກວ່າຮູບແບບອ້າງອີງທີ່ດີທີ່ສຸດ46% .

640 (6).png

ການປະສົມປະສານຜົນການປະເມີນຂອງສອງສະຖາບັນສາມາດເຫັນ,o1ຮູບແບບສະແດງຄວາມສາມາດທີ່ດີເລີດໃນການປະຕິບັດງານໂດຍລວມແລະແກ້ໄຂວຽກງານທີ່ສັບສົນແລະຍາກສູງ, ໂດຍສະເພາະໃນຄວາມທ້າທາຍທີ່ກ່ຽວຂ້ ເຖິງຢ່າງໃດກໍ່ຕາມ, ໃນຂົງເຂດສະເພາະ, ເຊັ່ນ: ພາລະກິດລະດັບເລີ່ມຕົ້ນດ້ານຄວາມປອດໄພຂອງເຄືອຂ່າຍ, ການປະຕິບັດ ດັ່ງນັ້ນ, ໃນຂະບວນການພັດທະນາແລະປັບປຸງໃນອະນາຄົດ,OpenaAIສາມາດສຸມໃສ່ການປັບປຸງປະສິດທິພາບໃນຂົງເຂດສະເພາະເຫຼົ່ານີ້ເພື່ອປັບປຸງຕໍ່ໄປo1ຫນ້າທີ່ແລະປະສິດທິພາບຂອງຮູບແບບ.

ນອກຈາກນັ້ນ, ການປະເມີນນີ້ຍັງເນັ້ນຫນັກເຖິງຄວາມສາມາດແລະຄວາມທ້າທາຍໃນຮູບແບບປັນຍາປະດິດໃນຫຼາຍຂົງເຂດ ໃນຂະນະທີ່ເຕັກໂນໂລຢີກໍາລັງພັດທະນາຢ່າງຕໍ່ເນື່ອງ, ຮູບແບບປັນຍາປະດິດໃນອະນາຄົດຈະສະແດງຄວາມສາມາດທີ່ເຂັ້ມແ ໃນຂະນະດຽວກັນ, ພວກເຮົາຍັງຕ້ອງໃຫ້ຄວາມສົນໃຈຢ່າງຕໍ່ເນື່ອງແລະແກ້ໄຂບັນຫາການປະຕິບັດງານຂອງຮູບແບບປັນຍາປະດິດໃນຂົງເຂດສະເພາະ



ເເຣແກດ:+856 2026 885 687     ຈີນ:+0086-27-81305687-0     ໂທລະໂທ:400-6689-651    

ອີເມວລ໌:qingqiaoint@163.com    /    qingqiaog5687@gmail.com

ສິດລະບຽບແພ່ນທີ່: ທົງລວມທັງຊຸມຊົນທີ່ສະພາບອາກາດ     ບໍ່ມີເອກ:鄂ICP备2021010908号

ບໍ່ລິການ

ຂໍ້ມູນເລກໃສ່
ໂທລະໂທ
400-6689-651

ໂປຣເເກຣມເຄື່ອງມືອງ

ບ້ານເຄື່ອນໄຫວ

ວິເຄດີສົນທະນາ

ໂປຣເເກຣມເຄື່ອງມືອງ

ໂທລະໂທ

facebook

ຈຸດເຊີ່ອມ