반복적 죄수의 딜레마 게임을 이용한 다중 에이전트의 전략(strategy)적 연합에 관한 연구
페이지 정보
작성일 23-01-11 19:15
본문
Download : 반복적 죄수의 딜레마 게임을 이용한 다중 에이전트의 전략적 연합에 관한 연구.hwp
에이전트가 가지고 있는 책략은 適應(적응)적 학습을 위해 유전자로 표현하는데 상대방과 자신의 이전에 행동에 대한 정보를 그대로 사용하는 Axelrod의 방법[3]을 사용한다. 이 방법은 상대방과 자신의 협동과 배반에 대한 정보를 …(생략(省略))
IPD게임은 그림 1과 같이 진화적으로 모델링할 수 있따 게임자의 전략(strategy)을 진화시키기 위해서 IPD게임이 끝난 후 에이전트...
Download : 반복적 죄수의 딜레마 게임을 이용한 다중 에이전트의 전략적 연합에 관한 연구.hwp( 42 )
순서
반복적 죄수의 딜레마 게임을 이용한 다중 에이전트의 전략(strategy)적 연합에 관한 연구
다. 게임자의 전략을 진화시키기 위해서 IPD게임이 끝난 후 에이전트... , 반복적 죄수의 딜레마 게임을 이용한 다중 에이전트의 전략적 연합에 관한 연구기타레포트 ,
2. 에이전트 모델
설명






,기타,레포트
2. 에이전트 모델
IPD게임은 그림 1과 같이 진화적으로 모델링할 수 있다아 게임자의 책략을 진화시키기 위해서 IPD게임이 끝난 후 에이전트들의 점수에 따라 적합도를 평가하고 우수한 책략을 선택(Selection)하여 교차(Crossover)하고 돌연변이(Mutation)를 통해 다음 세대의 책략을 생성하는 유전자 알고리즘(Genetic Algorithm)을 사용한다.
레포트/기타
2. 에이전트 모델IPD게임은 그림 1과 같이 진화적으로 모델링할 수 있다. 에이전트의 속성 중에서 이름과 메모리 그리고 책략은 모든 에이전트가 가지고 있는 속성이며 소속그룹과 신용도 및 등급은 연합에 소속된 에이전트만이 가지는 속성이다. 여기서 게임자는 행동 책략을 가진 에이전트로 볼 수 있으며 기본적으로 표 2와 같은 속성을 갖는다. 이러한 속성 중에서 이전 단계에서 이루어진 상대방과 자신의 각 행동은 에이전트의 메모리에 기억되는데 이러한 정보를 이용해 자신의 다음 행동을 결정한다.