130 likes | 275 Views
Big Data handling skill, Is it a key of performance ?. 기술경영학 협동과정 류성일 2012 년 12 월 10 일. 1. BigData 특징. Big Data 의 5 대 특징 : 대용량 , 다양성 , 속도↑ , 복잡성 , 분석모델無 ( 가트너 , 매킨지 , 베인 , 부즈 ). Bain & Company (2012), Navigating the Big Data challenge.
E N D
Big Data handling skill, Is it a key of performance ? 기술경영학 협동과정 류성일 2012년 12월 10일
1. BigData특징 Big Data의 5대 특징 : 대용량, 다양성, 속도↑, 복잡성, 분석모델無(가트너, 매킨지, 베인, 부즈) Bain & Company (2012), Navigating the Big Data challenge Booz&co. (2012), Benefitting from Big Data Leveraging Unstructured Data Capabilities for Competitive Advantage Gathner (2011), CEO Advisory : Bit Data Equals Big Opportunity Gathner (2011), Big Data Analytics James Manyika, Michael Chui, Brad Brown, Jacques Bughin, Richard Dobbs, Charles Roxburgh, Angela Hung Byers (2011), Big data: The next frontier for innovation, competition, and productivity, McKinsey Global Institute, McKinsey & Co.
1. BigData특징 Big Data의 분류 (IDC, 2011) IDC's Digital Universe Study, sponsored by EMC, June 2011
2. BigData 활용으로 기업이 얻는 효과 Big Data의 가치 : 투명성, 성과향상, 세그먼트, 의사결정, 신상품및BM 발굴 (McKinsey, 2011) James Manyika, Michael Chui, Brad Brown, Jacques Bughin, Richard Dobbs, Charles Roxburgh, Angela Hung Byers (2011), Big data: The next frontier for innovation, competition, and productivity, McKinsey Global Institute, McKinsey & Co.
3. BigData경쟁우위 Level BigData로 부터 경쟁우위를 얻기 위한 요건 James Manyika, Michael Chui, Brad Brown, Jacques Bughin, Richard Dobbs, Charles Roxburgh, Angela Hung Byers (2011), Big data: The next frontier for innovation, competition, and productivity, McKinsey Global Institute, McKinsey & Co. NIA (2012), 성공적인 빅데이터 활용을 위한 3대 요소 : 자원, 기술, 인력 Booz&co. (2012), Benefitting from Big Data Leveraging Unstructured Data Capabilities for Competitive Advantage
3. BigData경쟁우위 Level 1) ‘Tech. & Technique’ Level • → ‘4. BigData프로세스별 기술 Level’챕터에서… 2) ‘Access to data’Level • 데이터 원천 확보/확장을 위해 얼마나 노력하고 있는 지를 측정 • 전년도에 비해 확보 데이터 원천이 증가했는 지를 확인 3) ‘Organizational change and talent’Level • 데이터 전문가 영입 또는 육성 노력 수준을 평가 • 빅데이터 운용/분석 성과를 측정하기 위한 인사 제도 및 보상 체계 마련 수준 • 부문 리더가 빅데이터에 대한 이해를 갖추고 있는지 평가 4) ‘Data Policy’Level • 빅데이터 관련 프라이버시 침해, 보안 문제를 해결하기 위한 약관 마련, 제도 보완 • 기업 외부 및 타 부서간 Linked-Data 에 대한 소유권, 책임 등의 제도 마련
4. BigData프로세스별 기술 Level BigData프로세스 별, [Tech. & Technique] 리뷰 • Pete Warden (2011), Big Data Glossary, O’Reilly Media • 문혜정 (2011), Big Data 구축기술과 사례를 중심으로 • 안창원, 황승구 (2012), 빅데이터 기술과 주요 이슈
4. BigData프로세스별 기술 Level 1) Collecting및 Preprocess 단계 • 얼마나 풍부한 데이터 수집 방법을 도입하고 있는지를 평가 ex) 외부 Big Data 자동 수집 방법 (NIA, 2012) • 자신의 데이터가 내/외부 다른 소스의 데이터와 연계되고 인용되는 등,Linked Data가 만들어질 수 있는 수준 (다른 조직에서 데이터 시너지 효과 창출 가능성) NIA (2012), 빅데이터 시대의 데이터 자원 확보와 품질 관리 방안 2) Storage 및 Handling 단계 • 데이터를 기록/관리 캐파 향상을 위해 노력하고 있는지를 평가 • 전년도에 비해 확보 서버/스토리지 수준이 증가했는 지를 확인 • 메인프레임형 서버 → 분산형 서버로 교체 수준(예정)을 확인 • 비정형 데이터 처리 증가 수준 평가 ex) 분산형 스토리지 / 클라우드형 스토리지 운용 여부 평가 • 분산형 스토리지 혹은 클라우드형 스토리지 도입 수준 등으로 평가 • (ex: Hadoop등)
4. BigData프로세스별 기술 Level ex) 비정형 데이터를 기록/관리 수준으로 평가 • 비정형 데이터는 어느정도 구조적인 형태로 변형하여 저장해야 함(ex: Scribe, Flume, Chuckwa등의 오픈소스 솔루션) ex) Linked Data 5-Level (Berners-Lee, 2009) • 자신의 데이터가 내/외부 다른 소스의 데이터와 연계되고 인용되는 등,Linked Data가 만들어질 수 있는 수준 (다른 조직에서 데이터 시너지 효과 창출 가능성) Berners-Lee, T.(2009) Linked Data, http://www.w3.org/DesignIssues/LinkedData.html. ※ SPARQL은 RDF 트리플로 이루어진 그래프 구조의 시맨틱 웹 데이터를 효과적으로 질의하기 위한 언어 2008년 W3C의 권고안(Recommendation-http://www.w3.org/TR/rdf-sparql-query/)으로 제정된 SPARQL 1.0은 RDF, RDFS, OWL 과 같은 시맨틱웹 표준으로 기술된 시맨틱웹 데이터를 접근하기 위한 표준 4) Analysis 단계 • 데이터 분석 수준 및 범위 증대를 위해 노력하고 있는지를 평가 • 데이터 분석 과업에 투입한 시간x인력(MM)가 증가했는 지를 확인 • Hadoop등의 분산형빅데이터 분석 S/W 도입 수준을 평가 5) Expression단계 • 빅데이터 Visualization 툴 개발 노력 평가 • ‘클릭뷰’, ‘스팟파이어’ 등과 같은 데이터 Visualization 솔루션 도입 여부 평가 • 빅데이터 기반의 실시간 프리젠테이션 활용 정도 평가
5. R&D performance BSC(Balanced Scorecard)-based R&D 성과 지표 (kerssens-van Drongelen, 1997) • R&D 특성상 최종 제품이 아닌 경우가 대부분으로, 재무지표 외에 고객관점 및 혁신수행관점 등의 평가 척도가 포함됨 Kerssens-van Drongelen, I.C., and Cooke, A. (1997), Design principles for the development of measurement systems for research and development processes. R&D Management, 27, 4, 345–357.
6. 최종 연구 모형 BigData경쟁우위 Level R&DPerformance BigData프로세스별기술 Level BigDataManagement Level P7,8,9 Collecting & Preprocess P5,6 Storage & Handling Tech. & Technique P10 P4 Big data Management Level R&D Performance Analysis Access to data Expression Organizational change and talent Data Policy (moderator) 과업/프로세스의BigData연관성 BigData의요건 p2 Data Volumes How close it is to big data condition Data Structure Velocity ↑ Competitiveenvironment Processing Complexity p5 Competitive structure Analysis flexibility
7. 후속 작업 1) 추가 문헌 리뷰, 모형 단계별 측정 지표정교화 • 독립변수 : BigData프로세스별 기술 Level, BigData경쟁우위 Level • 종속변수 : R&D Performance - 조절변수 : Environment (조절변수) 2) 측정 서베이 설계 및 파일롯 테스트 • 파일롯 테스트 결과, 연구 모형 검토 및 수정 • 최종 서베이 문항 확정 3) 최종 서베이 수행 • 필요시서베이 전문 업체 용역 활용 • 여건이 허락한다면, 중/소vs대기업으로 설문 대상을 구분 4) 논문 작성 • 분석 결과의 시사점 수준에 따라, 논문의 향후 활용 방안 결정