안녕하세요~
IT에 몸담고 있는 미쓰황입니다^^
요즘 빅데이터가 떠오르면서 빅데이터전문가를 희망하는 학생들이 부쩍 많아졌는데요,
'R'
R은 통계계산과 그래픽을 위한 프로그래밍 언어이자 오픈소스 소프트웨어
무료라고 해서 기능이 약한 것도 아닌데, R에서 활용할 수 있는 다양한 패키지가 개발돼 있으므로, 패키지를 내려받아 다양한 기능 확장을 꾀할 수 있습니다.
현재 공식적으로 등록된 패키지만 7600개 이상인데, 그 외에 깃허브에서 내려받을 수 있는 패키지까지 고려하면 활용할 수 있는 패키지는 2만개가 넘는 것으로 알려졌습니다.
R은 벨 연구소에서 개발된 S언어를 바탕으로 만들어졌으며, 뉴질랜드 오클랜드 대학의 로스 이하카와 로버트 젠틀맨에 의해 시작됐습니다. 현재는 R코어팀이 개발을 맡고 있는데, 현재 3.2.3버전(우든 크리스마스 트리)까지 나왔습니다.
과거에는 SPSS같은 유료 통계 프로그램이 많이 사용됐지만, 최근엔 R 같은 통계 언어로 자신의 입맛에 맞는 분석 결과물을 만드는 경우가 늘고 있습니다. 한때 SPSS는 대학 내 조사방법론 강의의 필수 코스로 여겨졌지만, 지금은 서서히 밀려나는 분위기입니다.
R은 통계와 시각화에 특히 강점을 가지고 있고, 머신러닝 등에서도 활용됩니다.
확장성이 높은 R이지만, R이 꼭 전문가만 쓸 수 있는 기술은 아닌데요, 프로그래밍 언어를 모르는 사람들도 R에 입문해 데이터를 다루는 경우가 종종 있습니다. 국내에서도 업계와 학계를 가리지 않고 널리 사용되고 있습니다.
오늘은 여기까지. 1탄이었구요~
다음번에 2탄은 R스튜디오에 대해 간단히 설명드리겠습니다.
R프로그래밍 뿐만 아니라 빅데이터에 관심 있으신 분들
언제든 쪽지로 문의주세요^^