도서관 데이터분석개론

사회과학대학/문헌정보학과/전공선택

이 가이드는 부산대학교 사회과학대학 문헌정보학과 전공과목에 개설된 ‘도서관 데이터분석개론’ 강좌의 교육과 학습에 필요한 학술정보를 담고 있다. 데이터 분석, 빅데이터 분석, 데이터 과학자의 개념을 학습하고, 도서관 영역의 데이터와 데이터 분석의 적용 사례를 학습할 수 있다.

수강자의 TIP

학습정보가이드 서포터즈의 활동보고서와 댓글을 참고하여 작성되었습니다.

2025-2 [분반:001]

■ 대   면 ■ 발표수업 □ 현장체험 □ 중간고사 ■ 과제있음 □ 기타
□ 비대면 □ 조별과제 □ 시험없음 ■ 기말고사 □ 과제없음

<강의 운영 정보>

사회과학대학 문헌정보학과 2학년 2학기 전공선택

본 강의는 강의실에서 대면으로 진행된다. ‘도서관 데이터 과학’이라는 주교재가 있지만, 실제 강의 자료(PPT)만으로도 시험공부와 실습과제 수행에 무리가 없다.

9월 말까지는 이론 수업으로, 기말고사 범위에 해당하는 PPT(총 2강) 중심으로 강의가 진행된다.
이후 10월 초부터는 R 및 파이썬을 활용한 도서관 데이터 분석 실습이 이루어지며, 이 부분은 박사과정 수료생 선생님께서 담당하신다.
데이터 분석 수업 종료 이후인 11월 말부터 종강까지는 기말 과제는 경기도 도서관 장서분석 실습 발표가 진행된다.
(1차 발표) 도서관 소개 및 분석 계획서
(2차 발표) 현황분석 및 성과분석 결과
* 2차 발표는 출석부 역순으로 진행되며, 필수는 아니다. 발표 진행 시 교수님의 피드백을 받을 수 있다.

출석은 플라토 전자출결로 체크하며, 지각에는 비교적 관대하신 편이다. 과제나 기말고사 일정 등 주요 공지사항은 모두 수업시간 내에서 안내되기 때문에 수업을 집중하여 듣는 것이 좋다.

평가방법: 중간고사 대체 개인과제(20%), 기말고사(40%), 개인 실습 과제(30%), 출석(10%)

<강의정보>

■ 이론 (기말고사 범위)

  • 1~3주차: 데이터 과학 개론
    데이터와 분석, 빅데이터와 과학, 데이터 분석의 기본 개념을 학습했다. 기존의 디지털 인문학과 인공지능(인문 텍스트 마이닝)이 결합된 새로운 학문인 인문지능학에 대한 내용이 인상 깊었다.
  • 3~4주차: 도서관과 데이터 분석
    도서관 데이터의 유형, 운영 데이터, 서지 데이터, 운영 데이터 분석, 서지 데이터 분석, 데이터 마이닝, 텍스트 마이닝, 네트워크 분석 등을 배웠다.
    교수님께서 운영 데이터 분석과 서지 데이터 분석 파트를 강조하셨으며, 서지 데이터 분석은 중간고사 대체 과제인 연구동향분석과도 밀접한 관련이 있었다.

■ 실습

  • 5주차: R을 이용한 데이터 과학
    R 분석 환경을 설정하고, 기본적인 함수와 사용법을 익혔다.
  • 7주차: 도서관 통계데이터의 분석과 시각화
    국가도서관 통계시스템의 ‘2023년(’22년 실적) 공공도서관 입력데이터’를 활용하여 실제 도서관 통계데이터를 분석하고, 다양한 R 시각화 라이브러리를 이용해 막대그래프, 선그래프 등으로 시각화를 진행했다. 이때 주제별 장서 구성비, 자료구입비, 지역별 이용자 중 대출자 비율 등의 항목을 다뤘다.
  • 8주차: Python을 활용한 도서관 통계데이터의 분석과 시각화
    앞선 7주차의 R 실습과 유사한 내용을 파이썬으로 진행했으며, 두 언어의 문법과 사용법 차이점을 비교·정리했다.
  • 9주차: 서지데이터의 분석 실습
    ‘메르스’ 키워드를 대상으로 R 언어를 활용한 연구동향분석 실습을 진행했다. 중간고사 대체 과제와 밀접하게 관련된 내용이었다.
    *분석 항목: 저자빈도, 발행년빈도, 주제빈도
  • 10주차: 장서현황 분석
    해운대도서관을 사례로, 도서관정보나루 데이터를 활용한 장서현황 분석 방법을 R 언어로 학습했다. 기말 과제인 경기도 도서관 장서분석과 관련된 내용이었다.
    *분석항목: 장서수 분석, 대출수 분석, 미대출 장서수 분석
  • 11주차: 장서성과 분석
    10주차에서 수행한 현황분석과 동일한 데이터를 바탕으로 장서성과 분석을 진행했다. 마찬가지로 기말 과제와 밀접한 관련이 있었다.
    *분석항목: 장서회전율, 주제별 이용계수, 누더기도서, 사망도서, 인기주제분야, 장서증가율, 대출증가율
1주차 강의 개요 소개
– 데이터와 빅데이터
– 데이터 분석과 데이터 과학
9주차 개인 과제 실습

  • 문헌정보학 특정 분야의 연구 동향 분석
2주차 분야별 데이터 과학
– 디지털 인문학, 사회과학 연구와 데이터
– 문헌정보학과 데이터 과학
10주차 장서현황분석
– 데이터 반입과 전처리
– 현황분석과 시각화
3주차 도서관과 데이터분석
운영데이터와 정보원
서지데이터와 정보원
11주차 장서 성과 분석
– 데이터 반입과 전처리
– 성과분석
4주차 운영데이터 분석
– 운영 현황 분석
-운영 성과 분석
– 장서 성과 분석Operational data a
12주차 실습과제 계획서 작성 및 발표
– 자치구 단위 공공도서관 현황: 도서관 통계데이터 기준
– 분석대상 도서관의 선정
5주차 서지데이터 분석
– 데이터 마이닝
– 네트워크 분석
– 텍스트 마이닝
13주차 실습과제 발표 및 토론(1)
– 분석대상 도서관의 현황 분석
6주차 R을 활용한 데이터 과학
– R환경 구축
– R언어와 데이터
– 데이터의 구조, 처리 함수
14주차 실습과제 발표 및 토론(2)
– 분석대상 도서관의 현황 분석
7주차 도서관 통계데이터의 분석과 시각화
– 데이터 반입
– 데이터 전처리
– 기초통계 분석과 시각화
15주차 평가실습 발표 및 토론(3)
– 전체 보고서 발표
8주차 서지데이터의 분석
– 데이터 반입과 전처리
– 빈도분석
– 서지데이터
16주차 기말고사

<과제 정보>

  • 중간고사 대체 개인 과제

    • 과제 주제: 문헌정보학 특정 분야의 연구 동향 분석
    • 개요: ‘학교도서관’ 등 문헌정보학 분야의 특정 키워드를 중심으로 KCI 논문을 검색하여, 해당 키워드와 관련된 약 50편 내외의 논문을 선정한다. 이 논문들을 기반으로 분석항목과 분석방법을 설정하고, 연구동향을 분석한 후 결과보고서를 작성하여 제출한다.
    • 과제 방법: 먼저 주제 분야 키워드를 선정한 후, 9주차 강의인 ‘서지데이터의 분석 실습’ 강의자료를 참고하여 연구동향 분석을 진행한다. 분석결과를 정리하여 보고서를 작성하면 된다. 필요할 경우 기존 연구동향 분석 관련 KCI 논문을 참고하여 추가 분석을 수행할 수도 있다.보고서 작성 자체는 비교적 수월한 편이나, R언어를 활용한 분석 과정에서 데이터 전처리, 동명이인 처리 등에 시간이 많이 소요되기 때문에 미리 진행하는 것이 좋다.
    • 분량 및 제출 기한: 보고서 분량에는 제한이 없으며, 일반적으로 다들 5~10페이지 내외로 작성한다. 중간고사 대체 과제이지만 관련 분석 실습이 9주차에 진행되므로, 제출 기한은 중간고사 기간 이후로 비교적 여유 있게 주어진다.
  • 실습 개인 과제
    • 과제 주제: 경기도 도서관 장서분석 실습
    • 개요: 출석부 순으로 경기도 또는 인천광역시 내 자치구를 1인당 1곳씩 배정받는다. 도서관 수가 많은 자치구는 2명이 배정될 수 있다. 이후 각자 해당 자치구 도서관 1곳과 교육청 소속 도서관 1곳(교육청 도서관이 없을 경우 자치구 도서관 2곳)을 선택한다. 이 두 도서관을 대상으로 장서분석을 진행하고, 결과보고서를 작성한다.
    • 과제 발표: 각 학생은 도서관 소개 및 장서분석 실습 계획서 발표와 장서분석 결과 발표를 각각 1회씩, 총 2회 발표한다. 첫 번째 발표는 출석부 순서대로, 두 번째 발표는 출석부 역순으로 진행된다. 두 번째 발표는 필수는 아니지만, 발표를 진행할 경우 교수님의 피드백을 받을 수 있다. 발표는 과제 점수에 반영되지 않는다.
    • 과제 방법: 보고서에는 배정받은 지역의 도서관 체계 및 선정 도서관 소개, 현황분석과 성과분석, 분석결과를 바탕으로 한 도서관 액션플랜 제안이 포함되어야 한다. 현황분석과 성과분석은 10주차와 11주차 강의자료를 답습하며 수행하면 된다. 보고서는 서론–본론–결론의 보고서 형식을 갖추어 작성해야 한다. 보고서에 포함해야 할 내용이 많아서 시간이 오래 걸렸다.
    • 분량 및 제출 기한: 분량 제한은 없으나, 분석결과를 나타내기 위한 표와 그래프가 많이 들어가기에 다들 15~20페이지 내외로 작성한다. 과제 제출 기한은 종강 이후 약 일주일 정도로 비교적 여유 있게 주어진다.

<시험 정보>

  • 중간고사는 과제로 대체되며, 기말고사는 1회 실시된다. 시험 범위는 강의자료 1, 2장이며, 3문제 중 2문제를 선택하여 답하는 서술형 시험으로 진행된다.
    3문제를 모두 풀더라도 반드시 채점을 원하는 2문제를 지정해야 한다.
  • 시험 공부법
    • 교수님께서 과제는 크게 변별력이 없고, 기말고사 결과에 따라 거의 학점이 결정된다고 언급하신 바 있어, 기말고사 준비에 몰두하는 것이 좋을 것 같다. 시험범위에 비해 문제 출제범위가 좁기 때문에 특정 부분만 준비하기보다는 전 범위를 고르게 공부하는 게 좋다.강의자료의 분량은 많지 않아 보이지만 슬라이드마다 내용이 많아 체감 학습량은 적지 않은 편이다. 미리 공부하며 주제별로 암기하는 것이 좋다. 전반적으로 교수님께서 수업시간에 강조하신 내용이 시험에 반영되는 것 같다고 느꼈다.
  • 시험문제 예시(교수님께서는 매해 시험 문제를 바꿔서 출제하심)
    • 공공데이터 설명하기(정의, 도서관 영역의 주요 공공데이터 사례)
    • 구글의 독감추세분석(GFT) 설명하기(주요내용&비판 핵심)
    • EBSM 방법론 설명하기(주요내용&핵심성과지표 설명)

강의 참고 도서

추천 저널

추천 논문

더 찾아보기
저자 장민; 임세진; 임준묵
대한산업공학회 추계학술대회 논문집. 2023-11 2023(11):2199-2202
저자 노지윤 (Jiyoon Ro); 정대근 (Daekeun Jeong)
한국콘텐츠학회논문지. 2026-01 26(1):354-363
저자 이순영 (부산대학교); 이수상 (부산대학교)
한국문헌정보학회지, Journal of the Korean Society for Library and Information Science. 2021-11-30 55(4):89-114

본 가이드는 부산대학교 도서관데이터분석개론 강의 및 학습을 지원하기 위해 작성되었습니다.

댓글 0