상세 컨텐츠

본문 제목

[ Python 기초 문법 ] - 자료형(6) - 집합 자료형

Language/Python

by bing_su 2021. 2. 27. 23:02

본문

반응형
SMALL

이번에 다룰 자료형은 집합 자료형이다. 집합(set)은 Python 2.3부터 지원하기 시작한 자료형으로, 집합에 관련된 것을 쉽게 처리하기 위해 만든 자료형이다.

[ 집합 자료형의 생성 ]

집합 자료형은 set 키워드를 사용해 만들 수 있다. set()의 괄호 안에 리스트를 입력해서 만들거나 문자열을 직접 입력해 만들 수도 있다. 비어 있는 집합 자료형은 s = set()로 만들 수 있다.

>>> s1 = set([1, 2, 3])
>>> s1
{1, 2, 3}

>>> s2 = set("Hello")
s2
{'e', 'H', 'l', 'o'}

[ 집합 자료형의 특징 ]

set에는 아래와 같은 2가지 큰 특징이 있다.

  • 중복을 허용하지 않는다.
  • 순서가 없다(Unordered).

중복을 허용하지 않는 set의 특징을 이용해서 데이터의 중복을 제거하기 위한 역할로 집합 자료형이 종종 사용된다.

 

리스트나 튜플은 순서가 있어(ordered) 인덱싱을 통해 자료형의 값을 얻을 수 있지만, set과 딕셔너리 자료형은 순서가 없어(unordered) 인덱싱으로 값을 얻을 수 없다. set 자료형에 저장된 값을 인덱싱으로 접근하려면 리스트나 튜플로 변환 후 인덱싱을 사용해야 한다.

>>> s1 = set([1, 2, 3])
>>> l1 = list(s1)  # 리스트로 변환
>>> l1
[1, 2, 3]
>>> l1[0]
1
>>> t1 = tuple(s1)  # 튜플로 변환
>>> t1
(1, 2, 3)
>>> t1[0]
1

[ 교집합, 합집합, 차집합 구하기 ]

아래와 같은 두 set 자료형이 있다고 해 보자.

>>> s1 = set([1, 2, 3, 4, 5, 6])
>>> s2 = set([4, 5, 6, 7, 8, 9])

< 교집합 >

'&' 기호를 사용하면 교집합을 간단히 구할 수 있다. 혹은 intersection 함수를 이용해도 된다.

>>> s1 & s2
{4, 5, 6}
>>> s1.intersection(s2)
{4, 5, 6}
>>> s2.intersection(s1)
{4, 5, 6}

< 합집합 >

합집합은 '|' 기호나 union 함수를 통해 구할 수 있다. 중복된 값은 한 개씩만 표현된다.

>>> s1 | s2
{1, 2, 3, 4, 5, 6, 7, 8, 9}
>>> s1.union(s2)
{1, 2, 3, 4, 5, 6, 7, 8, 9}
>>> s2.union(s1)
{1, 2, 3, 4, 5, 6, 7, 8, 9}

< 차집합 >

차집합은 '마이너스(-)' 기호나 difference 함수를 사용해서 구할 수 있다.

>>> s1 - s2
{1, 2, 3}
>>> s2 - s1
{8, 9, 7}
>>> s1.difference(s2)
{1, 2, 3}
>>> s2.difference(s1)
{8, 9, 7}

[ 집합 자료형 관련 함수 ]

< 값 1개 추가 (add) >

이미 만들어진 set 자료형에 값을 추가할 수 있다. 1개의 값을 추가할 수 있다.

>>> s1 = set([1, 2, 3])
>>> s1.add(4)
>>> s1
{1, 2, 3, 4}

< 값 여러 개 추가 (update) >

값을 여러 개 한꺼번에 추가(update)할 때 사용한다.

>>> s1 = set([1, 2, 3])
>>> s1.update([4, 5, 6])
>>> s1
{1, 2, 3, 4, 5, 6}

< 특정 값 제거하기 (remove) >

>>> s1 = set([1, 2, 3])
>>> s1.remove(2)
>>> s1
{1, 3}
반응형
LIST

관련글 더보기

댓글 영역