연구 및 데이터 분석 분야에서는 다양한 유형의 데이터를 이해하는 것이 의미 있는 결론을 도출하고 정보에 입각한 의사 결정을 내리는 데 필수적입니다. 이러한 유형 중 하나는 사회과학에서 시장 조사에 이르기까지 다양한 분야에서 중요한 역할을 하는 서수 데이터입니다. 데이터 집합에서 의미 있는 인사이트를 추출하려는 연구자에게는 서수 데이터가 무엇을 나타내고 다른 데이터 유형과 어떻게 다른지 이해하는 것이 필수적입니다. 이 글에서는 서수 데이터가 무엇이며 연구 분야에서 서수 데이터가 갖는 의미에 대해 포괄적으로 설명합니다.

서수 데이터란 무엇인가요?

서수 데이터는 범주에 자연스러운 순서 또는 순위가 있는 범주형 데이터의 한 유형입니다. 즉, 상대적 가치 또는 중요도에 따라 순위를 매기거나 정렬할 수 있는 방식으로 카테고리가 정렬되어 있습니다. 예를 들어, 응답자에게 1부터 5까지의 척도로 동의 수준을 평가하도록 하는 설문조사 질문은 응답이 '매우 동의하지 않음'(1)에서 '매우 동의함'(5)까지 자연스러운 순서를 가지므로 서수 데이터를 수집하는 것입니다. 서수 데이터 예시는 카이제곱 검사와 같은 통계적 방법을 사용하여 분석할 수 있지만 범주 간 거리가 같지 않을 수 있으므로 주의가 필요합니다.

서수 데이터는 데이터를 자연스러운 순서 또는 순위로 분류하고 비교할 수 있어 데이터 내의 패턴, 관계 및 추세에 대한 귀중한 인사이트를 제공할 수 있기 때문에 과학 연구에서 매우 중요합니다. 이러한 유형의 데이터는 응답자에게 자신의 의견이나 경험을 척도로 평가하도록 요청하는 설문조사나 설문지와 같은 사회과학 연구에 자주 사용됩니다.

그림: https://www.voxco.com/wp-content/uploads/2021/03/Cover-scale-1536×864.jpg

서수 데이터의 특성

서수 데이터는 범주 데이터의 한 유형으로, 범주 간의 특정 순서 또는 순위를 나타냅니다. 다음은 서수 데이터의 몇 가지 주요 특징입니다:

주문: 서수 데이터의 범주에는 특정 순서 또는 순위가 있으며, 이 순서는 동의, 동의하지 않음 또는 선호 수준을 나타냅니다. 예를 들어, 받은 서비스 품질에 대해 묻는 설문조사에서 응답 옵션은 '우수', '좋음', '보통' 또는 '나쁨'으로 명확한 순서를 가질 수 있습니다.

숫자가 아닙니다: 서수 데이터 범주는 반드시 숫자로만 표시되는 것은 아니며, 단어나 기호로 표시될 수도 있습니다. 예를 들어, 레스토랑 평가 시스템에서는 숫자 대신 별을 사용하여 품질 수준을 나타낼 수 있습니다.

간격이 동일하지 않습니다: 범주 간의 거리가 반드시 같을 필요는 없습니다. 예를 들어, 리커트 척도에서 "매우 동의함"과 "동의함"의 차이는 "동의하지 않음"과 "매우 동의하지 않음"의 차이와 같지 않을 수 있습니다.

카테고리 수가 제한되어 있습니다: 서수 데이터에는 일반적으로 연구자가 미리 정의한 한정된 수의 카테고리가 있습니다. 예를 들어, 설문조사에서 5개의 응답 옵션이 있는 리커트 척도를 사용할 수 있습니다.

숫자 데이터로 취급할 수 있습니다: 통계 분석 목적으로 서수 데이터를 숫자 데이터로 취급할 수 있는 경우가 있지만, 이 경우 주의해야 합니다. 서수 범주에 의미 있는 숫자 값을 할당하면 분석과 해석을 용이하게 할 수 있지만, 데이터의 본질적인 특성을 변경해서는 안 됩니다.

서수 변수의 유형

서수 변수는 값 또는 속성을 기준으로 순위를 매기거나 순서를 지정할 수 있는 변수입니다. 서수 변수에는 두 가지 유형이 있습니다:

일치하는 카테고리

일치하는 범주 서수 변수에서는 변수의 범주에 자연스러운 순서가 있습니다. 이 순서는 변수 자체에 의해 정의되며 범주는 상호 배타적입니다. 예를 들어, 전후 연구 설계에서는 동일한 참가자 그룹이 치료 전후와 같이 서로 다른 두 시점에 동일한 서수 변수로 측정됩니다. "이전" 측정의 범주는 "이후" 측정의 범주와 일치하거나 짝을 이룹니다. 

또 다른 예로는 한 파트너의 선호도가 다른 파트너의 선호도와 일치하거나 짝을 이루는 특정 측면에 대한 커플의 선호도를 비교하는 연구가 있습니다. 매칭된 카테고리는 종종 윌콕슨 부호 순위 테스트 또는 프리드먼 테스트와 같은 비모수 통계 테스트를 사용하여 각 쌍 또는 그룹 내의 카테고리 간의 차이를 비교하여 분석합니다.

독보적인 카테고리

일치하지 않는 카테고리는 또 다른 유형의 서수 변수입니다. 일치하는 범주와 달리 일치하지 않는 범주는 범주 간에 명확한 관계나 연결이 없습니다. 예를 들어 응답자에게 여러 유형의 음악 장르에 대한 선호도를 평가하도록 요청하는 경우 재즈, 컨트리, 록 범주 간에 명확한 순서나 관계가 없을 수 있습니다.

일치하지 않는 카테고리의 경우 응답자의 개별 선호도나 인식에 따라 카테고리가 정렬될 수 있지만 모든 응답자에게 적용되는 객관적이거나 일관된 정렬이 없습니다. 따라서 명확하고 일관된 순서가 있는 일치하는 범주에 비해 데이터를 분석하고 해석하기가 더 어려울 수 있습니다.

서수 데이터의 예

서수 데이터의 예는 많은 연구 분야와 다양한 유형의 측정에서 찾을 수 있습니다. 서수 데이터의 몇 가지 예는 다음과 같습니다:

간격 스케일

간격 척도는 각 범주 또는 응답에 숫자 값이 할당되어 있고 값 간의 차이가 의미 있고 동일한 측정 척도의 한 유형입니다. 비율 눈금과 유사하지만 진정한 영점이 없다는 점이 다릅니다.

예를 들어 섭씨 온도 눈금은 간격 눈금의 예입니다. 10°C와 20°C의 차이는 20°C와 30°C의 차이와 동일합니다. 그러나 0°C는 온도가 전혀 없는 것이 아니라 눈금의 특정 지점을 나타냅니다.

리커트 척도

리커트 척도는 '매우 동의함', '동의함', '중립', '동의하지 않음', '매우 동의하지 않음' 등의 응답 옵션 세트를 사용하여 태도, 의견 또는 인식을 측정하는 일반적인 유형의 서수 데이터입니다. 각 응답에는 일반적으로 1~5 또는 1~7 범위의 숫자 값이 할당되며, 값이 높을수록 더 긍정적이거나 강한 응답을 나타냅니다. 리커트 척도는 특정 방법을 사용하여 분석할 수 있는 서수 데이터를 수집하기 위해 설문조사 및 설문조사에서 자주 사용됩니다.

서수 데이터는 어떻게 분석하나요?

서수 데이터를 분석하는 방법에는 다음과 같은 여러 가지가 있습니다:

설명 통계: 기술 통계는 서수 데이터의 중심 경향과 분포를 요약하고 설명하는 데 사용됩니다. 서수 데이터에 일반적으로 사용되는 설명 통계에는 중앙값, 모드 및 백분위수가 있습니다. 기술 통계는 데이터에 대한 일반적인 개요를 제공하고 이상값이나 왜곡된 분포와 같은 잠재적인 문제를 식별하는 데 도움이 될 수 있습니다. 그러나 그룹 간의 차이 또는 관계의 통계적 유의성에 대한 정보는 제공하지 않습니다.

비매개변수 테스트: 비모수 검정에서는 데이터가 정규 분포와 같은 특정 분포를 따를 필요가 없고 범주 사이의 간격이 동일하다고 가정하지 않기 때문에 일반적으로 서수 데이터를 분석하는 데 사용됩니다. 이러한 테스트는 관측값의 정확한 값보다는 관측값의 순위를 기반으로 합니다. 비모수 검정법은 이상값에 대해 강력하며 모수 검정법의 가정이 충족되지 않을 때 자주 사용됩니다. 그러나 특히 표본 크기가 작은 경우 모수 검정보다 통계적 검정력이 떨어질 수 있습니다. 

서수 로지스틱 회귀: 서수 로지스틱 회귀는 하나 이상의 서수 독립 변수와 서수 종속 변수 간의 관계를 모델링하는 데 사용되는 통계 방법입니다. 이 방법은 서수 변수의 결과에 영향을 미치는 요인을 파악하고자 할 때 유용합니다. 서수 로지스틱 회귀는 종속 변수의 범주가 정렬되어 있고 범주 간의 거리가 반드시 같지는 않다고 가정합니다. 또한 종속 변수와 독립 변수 간의 관계가 로그 선형이라고 가정합니다.

서신 분석: 이 방법은 둘 이상의 서수 변수 간의 관계를 탐색하는 데 사용됩니다. 변수 간의 패턴과 관계를 식별하고 2차원 공간에서 시각화하는 데 도움이 됩니다. 이 방법에는 각 변수에 대한 각 범주의 빈도를 보여주는 우연도 테이블을 만드는 것이 포함됩니다. 그런 다음 데이터의 전체 분포를 기반으로 각 범주에 대한 점수 집합을 계산합니다. 이 점수는 각 카테고리가 점으로 표시되는 2차원 플롯을 만드는 데 사용됩니다. 점 사이의 거리는 카테고리 간의 유사성 또는 비 유사성을 나타냅니다.

구조 방정식 모델링: 구조방정식 모델링(SEM)은 변수 간의 관계를 분석하고 복잡한 모델을 테스트하는 데 사용되는 통계적 방법입니다. 관찰 변수와 잠재 변수를 모두 처리할 수 있고 변수 간의 인과 관계를 테스트할 수 있는 다변량 분석 기법입니다. 서수 데이터를 분석할 때 SEM을 사용하면 여러 서수 변수와 잠재 구조를 포함하는 모델을 테스트할 수 있습니다. 또한 변수가 서로에 미치는 직간접적인 영향의 크기를 식별하고 추정하는 데에도 도움이 될 수 있습니다.

추론 통계

추론 통계는 데이터 샘플을 기반으로 모집단에 대한 결론을 도출하고 추론하는 통계학의 한 분야입니다. 연구자가 관찰된 데이터를 넘어 더 큰 집단에 대한 일반화, 예측, 가설을 세울 수 있는 강력한 도구입니다.

기술 통계는 데이터를 요약하고 설명하는 반면, 추론 통계는 확률 이론과 통계적 방법을 사용하여 샘플 데이터를 분석하고 샘플이 추출된 모집단에 대한 결론을 도출함으로써 한 단계 더 나아갑니다. 연구자는 추론 통계를 활용하여 예측을 하고, 가설을 테스트하고, 조사 결과를 바탕으로 정보에 입각한 의사 결정을 내릴 수 있습니다.

서수 데이터의 사용

서수 데이터는 다양한 애플리케이션에서 사용되며 설문조사, 설문지 및 기타 형태의 연구를 통해 수집되는 경우가 많습니다. 다음은 서수 데이터의 몇 가지 일반적인 용도입니다:

설문조사/설문지

설문조사와 설문지는 서수 데이터를 수집하는 일반적인 방법입니다. 예를 들어 설문조사에서 응답자에게 "매우 동의하지 않음"에서 "매우 동의함"까지의 척도로 진술에 대한 동의 수준을 평가하도록 요청할 수 있습니다. 이러한 유형의 데이터는 응답의 추세나 패턴을 분석하는 데 사용할 수 있습니다.

연구

서수 데이터는 여러 변수 간의 관계를 측정하기 위한 연구에서도 사용할 수 있습니다. 예를 들어, 연구자는 특정 질병을 앓고 있는 환자 그룹에서 특정 증상의 심각도를 측정하기 위해 서수 척도를 사용할 수 있습니다. 이러한 유형의 데이터는 여러 환자 그룹에서 증상의 심각도를 비교하거나 시간에 따른 증상의 변화를 추적하는 데 사용할 수 있습니다.

고객 서비스

고객 서비스에서도 서수 데이터를 사용하여 고객 만족도 또는 불만족도를 측정할 수 있습니다. 예를 들어, 고객에게 회사의 제품이나 서비스에 대한 경험을 "매우 불만족"에서 "매우 만족"까지의 척도로 평가하도록 요청할 수 있습니다. 이러한 유형의 데이터는 개선이 필요한 영역을 식별하고 시간 경과에 따른 고객 만족도의 변화를 추적하는 데 사용될 수 있습니다.

입사 지원

서수 데이터는 입사 지원서에서 지원자의 자격이나 경력 수준을 측정하는 데에도 사용할 수 있습니다. 예를 들어, 고용주는 입사 지원자에게 특정 분야에 대한 자신의 경험 수준을 "경험 없음"에서 "전문가"까지의 척도로 평가하도록 요청할 수 있습니다. 이러한 유형의 데이터는 여러 입사 지원자의 자격을 비교하고 해당 직무에 가장 적합한 지원자를 선택하는 데 사용될 수 있습니다.

서수 데이터와 명목 데이터의 차이점

서수 데이터와 명목 데이터는 범주형 데이터의 두 가지 유형입니다. 이 둘의 주요 차이점은 측정 수준과 전달되는 정보에 있습니다.

서수 데이터는 변수가 자연스러운 순서 또는 순위를 갖는 범주형 데이터의 한 유형입니다. 서수 수준에서 측정되므로 자연스러운 순서를 갖지만 값 간의 차이를 정량화하거나 측정할 수 없습니다. 서수 데이터의 예로는 순위, 평점, 리커트 척도 등이 있습니다.

반면에 명목 데이터는 범주형 데이터의 한 유형이지만 자연스러운 순서나 순위가 없습니다. 명목 데이터는 명목 수준에서 측정되며, 이는 데이터가 고유한 순위나 순서 없이 상호 배타적인 범주로만 분류될 수 있음을 의미합니다. 명목 데이터의 예로는 성별, 인종, 결혼 여부 등이 있습니다.

서수 데이터와 명목 데이터의 주요 차이점은 서수 데이터에는 자연스러운 순서 또는 순위가 있는 반면, 명목 데이터에는 그렇지 않다는 것입니다. 서수 데이터와 명목 데이터의 차이점에 대해 자세히 알아보려면 다음을 확인하세요. 이 웹 사이트.

아주 구체적인 일러스트가 필요하신가요? 저희가 디자인해 드립니다!

Mind the Graph 플랫폼은 복잡한 과학 개념과 필요한 특정 이미지가 포함된 광범위한 과학 일러스트레이션 및 템플릿 라이브러리를 제공합니다. Mind the Graph는 여러분의 기대에 부응하는 고품질 일러스트레이션을 제작하기 위해 여러분과 협력할 것입니다. 이 서비스를 이용하면 전문 디자인 소프트웨어나 기술 없이도 연구, 프레젠테이션 또는 출판에 필요한 정확한 비주얼을 얻을 수 있습니다.

로고 구독

뉴스레터 구독하기

효과적인 비주얼에 대한 독점 고품질 콘텐츠
과학 분야의 커뮤니케이션.

- 독점 가이드
- 디자인 팁
- 과학 뉴스 및 동향
- 튜토리얼 및 템플릿