토요일, 4월 20, 2024
Home자동화기여 | 비즈니스 분석가들이 '파이썬'을 주목하는 이유

기여 | 비즈니스 분석가들이 ‘파이썬’을 주목하는 이유


비즈니스 분석가들은 BI 도구의 한계를 뛰어넘고 보다 고급 분석을 수행할 수 있는 방법을 찾고 있습니다. 파이썬이 핵심입니다.

기업의 성공에 데이터가 그 어느 때보다 중요해짐에 따라 Python은 데이터 전문가를 넘어 비즈니스 분석 및 기타 비기술적 사용자에게도 채택되고 있습니다. Python을 비교적 처음 접하는 경우 어떤 기회가 있으며 성공하려면 어떤 모범 사례를 알아야 합니까?

ⓒ게티이미지뱅크

많은 기업에서 비즈니스 요구 사항은 데이터 팀의 리소스와 역량을 초과하며, 데이터 전문가는 찾기 힘든 유니콘과 같습니다. 한편, 비즈니스 분석가들은 BI 도구가 수행할 수 있는 작업의 한계를 뛰어넘고 있으며 점점 더 고급 분석을 수행할 수 있는 방법을 찾고 있습니다. 여기서 성공의 열쇠는 Python입니다.

Python 사용이 빠르게 증가하고 있습니다. 올해 초 2만명 이상의 개발자를 대상으로 한 설문조사 SlashData의 개발자 국가 현황 조사에 따르면: Python은 JavaScript에 이어 인기 순위 2위를 차지하고 있으며 Python은 지난 6개월 동안 330만 명의 고유 신규 사용자를 추가하여 전 세계적으로 1,570만 명의 사용자에 도달했습니다.

최근 몇 년 동안 Python 커뮤니티는 고급 분석, 기계 학습 및 앱 개발을 위해 비전문가가 언어에 더 쉽게 접근할 수 있도록 하는 새로운 프레임워크와 패키지를 만들었습니다. 그 예로는 숫자 데이터용 오픈 소스 Python 라이브러리인 NumPy, 예측 실행을 위한 Prophet, 지리공간 데이터 조작을 위한 H3 프로젝트(Uber에서 시작)가 있습니다.

비전문 개발자들 사이에서 Python이 확산되는 것은 전례가 없는 일이 아닙니다. 셀프 서비스 BI 도구의 출현으로 비즈니스 사용자가 자신의 Excel 매크로를 스크립팅하는 방법을 배우면서 유사한 패턴이 나타났습니다. 언어 자체가 매우 유용하기 때문에 앞으로 활용도가 더욱 높아질 것으로 예상됩니다.

Python 분석 시작하기
비즈니스 사용자는 어떤 특정 통찰력이 비즈니스에 유용한지 전문 개발자보다 더 잘 알고 있습니다. 다음은 Python의 세 가지 기본 사용 사례입니다.

(1) 상관 행렬
상관행렬은 다양한 변수에 대한 상관계수를 보여주는 표이다. 이를 통해 데이터 세트의 다양한 차원을 분석할 수 있습니다. 예를 들어, A 행동을 보이는 사람이 B 행동을 보일 가능성이 있는지 판단할 수 있습니다. 예를 들어 식료품점에서 어떤 제품을 서로 가까이 배치할지 결정하는 경우에도 상관 행렬이 유용합니다.

(2) 주성분 분석
두 번째 사용 사례는 주성분 분석으로, 시끄러운 데이터 세트의 크기를 줄이고 주어진 결과를 가장 잘 예측하는 속성을 결정할 수 있습니다. 예를 들어, 회사가 모기지를 판매하는 경우 주성분 분석을 사용하여 구매할 가능성이 가장 높은 인구통계학적 요인(예: 소득, 거주지, 결혼 여부 등)을 식별하고 이에 따라 캠페인 및 제안을 타겟팅할 수 있습니다.

(3) 예측
기업의 또 다른 문제는 예측입니다. 모든 기업이 수행해야 하는 고객 수요, 판매 또는 수익 예측에 대해 생각해 보십시오. 예측 작성은 Prophet 또는 Scikit-Learn과 같은 오픈 소스 라이브러리를 사용하여 Python에서 예측 분석을 탐색하는 방법입니다.

한편, 큰 힘에는 큰 책임이 따르며, 새로운 Python 사용자가 구축하는 애플리케이션이 강력하고 안전한지 확인하기 위해 고려해야 할 모범 사례가 있습니다.

파이썬 관리
한 가지 과제는 종속성이 적절하게 관리되도록 Python 패키지를 유지 관리하는 것입니다. Anaconda는 패키지 관리 및 배포를 단순화하므로 여기서 유용합니다. Snowflake의 Python용 Snowpark는 Anaconda 기본 채널에서 가장 널리 사용되는 Python 패키지를 Python 런타임에 사전 설치하므로 수동 설치가 필요하지 않습니다. Conda 패키지 관리자를 Snowpark에 통합하여 Python 패키지와 해당 종속성을 관리할 수도 있습니다.

모든 데이터 프로젝트와 마찬가지로 보안 및 거버넌스 문제가 있지만 최신 클라우드 데이터 플랫폼은 사전 구성 및 구성된 런타임을 제공하며 사용자는 해당 플랫폼에 내장된 보안 및 거버넌스 기능을 활용할 수 있습니다. 예를 들어 Snowpark의 Python 런타임은 데이터 유출과 같은 일반적인 보안 문제로부터 보호하기 위해 기본적으로 외부 네트워크 액세스를 허용하지 않습니다. 새로운 Python 사용자에게는 Snowpark와 같이 사전 구성되고 안전한 Python 런타임을 사용하는 것이 훨씬 쉽습니다.

아직은 초기 단계이지만 시간이 지나면서 비전문 개발자를 대상으로 하는 추가 Python 도구와 리소스가 나올 것으로 예상됩니다. 개발해야 할 또 다른 영역은 Python 사용자가 언어를 모르는 동료와 작업을 공유할 수 있는 방법입니다. 부분적으로 이 문제를 해결하기 위해 Snowflake는 Streamlit을 인수했습니다. 오픈 소스 도구를 사용하면 데이터 팀은 기술 지식이 없는 사용자를 위해 데이터를 시각적으로 생생하게 전달하는 애플리케이션을 구축할 수 있습니다. Python 자체는 애플리케이션 구축을 위한 강력한 언어이기 때문에 Python을 사용하여 최종 사용자를 위한 데이터 애플리케이션을 구축하면 언어가 더욱 널리 사용될 것입니다.

RealPython은 Python에 대한 초보자 가이드를 제공합니다. Python 소프트웨어 재단에는 조언을 얻고 질문에 답할 수 있는 활발한 커뮤니티도 있습니다. Snowflake 사용자라면 여기 Python 개발을 지원하는 Snow Park 개발자 환경을 살펴보실 수 있습니다. 전 세계의 수많은 Snowflake 커뮤니티 사용자 그룹 중 하나에 가입할 수도 있습니다.

* Torsten Grabs는 Snowflake의 제품 관리 이사입니다. ciokr@idg.co.kr



RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisment -
Google search engine

Most Popular

Recent Comments