Skip to content

(최*현) (강의노트 6장) XGBoost 다중 분류 목적함수 #161

@ch101634

Description

@ch101634
Image

강의노트 4장에서 이진 분류에서는 로지스틱 회귀를 사용하고, 클래스가 여러 개인 다중 분류에서는 소프트맥스 회귀를 사용한다고 배웠습니다. 그래서 저는 로지스틱 방식은 주로 이진 분류에 사용되고, 붓꽃 데이터셋처럼 클래스가 세 개인 경우에는 소프트맥스 방식의 다중 분류 설정이 필요하다고 이해하고 있었습니다.

그런데 6장 코드 워크아웃의 XGBoost 붓꽃 데이터셋 분류 예제에서는 붓꽃 품종이 세 클래스임에도 XGBClassifier의 목적함수(objective)가 binary:logistic으로 지정되어 있습니다. 트리 모델이 각 노드에서 데이터를 두 갈래로 나누더라도, 최종적으로 예측해야 하는 품종은 세 개이므로 이 문제는 다중 분류라고 이해했습니다. 같은 코드 워크아웃의 MNIST 분류 예제에서는 objective="multi:softprob"을 쓰고 있어서, 붓꽃 예제에서 왜 binary:logistic을 쓴 건지 더 헷갈렸습니다.

제가 이해한 바로는 클래스가 여러 개인 경우에는 소프트맥스 방식이 사용되어야 할 것 같은데, 이 예제에서 binary:logistic이 사용된 이유가 궁금합니다. 로지스틱 방식도 다중 분류에 사용할 수 있는 것인지, 아니면 XGBoost에서는 이런 설정도 허용되는 것인지 궁금합니다.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions