SlideShare ist ein Scribd-Unternehmen logo
1 von 30
[MIM 대화 분석]

데이터 개요
                    데이터 특성                                    2 group         >=3 group
                         총계                                    35개              49개
                    총 발화 횟수                                  63177 회          70584 회



분석 방법
1. 전반적인 발화 간격 측정
2. 대화방 참여 후 첫 발화까지의 시간 측정
3. 발화 순서 (Crossing Ratio) 측정
4. 이모티콘 연쇄 빈도 측정
5. 1-gram 빈도 측정


이 분석은 융합기술대학원 사용자경험연구실 오재혁연구원에 의해 수행되었습니다.
(email : return2music@gmail.com, facebook:http://www.facebook.com/jaehyeuk)

실험 어플리케이션 페이지 : http://ix.snu.ac.kr/~iot/ms/index.html
실펌 페이스북 페이지 : http://www.facebook.com/WhoisFreerider
발화 간격 : 바로 이어진 발화 사이의 시간 간격

=2 group : 1분 이내 발화가 많다.
>=3 group : 전반적으로 2 group 보다 1분을 넘는 발화 간격의 빈도가 높다.

발화 간격 빈도 변화량 (기울기) 의 변화를 보았을때,
1분,3분, 1시간,3시간 에서 변화 정도에 특이점이 있다.
위 시점을 기준으로 발화 양상에 차이가 있을 수 있다고 가정하고 다음의 분석을 진행했
다.                       =2 >=3 발화간격빈도비교
        0.0500




        0.0375




        0.0250




        0.0125




            0
                 2   5   8   11 14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59   3   6   9   12 15 18 21 1day 4   7   10
                                                     =2                  >=3
앞의 분석에서 한시간을 넘는 발화 간격이 적지 않음을 보았기에,
이러한 늦은 응답이 어떻게 일어나는지 보고자 했다.

이 그래프의 X 축은 직전 발화의 시각
Y 축은 그 발화에 응답하여 이루어진 발화의 시각이다.
파란색은 3인 이상, 녹색은 2인 그룹의 발화 패턴이다.

이 그래프에서 =2, >=3 Group 간 차이는                >=3, =2, 1시간초과발화 시점비교
보이지 않는다.                  24




                         20




                         16




                         12


                                                                              자고 일어나서
                                                                              응답하는 패턴

                          8

                                       일과 시간에 조금 늦게
                                       응답하는 패턴

                          4




                          0
                               0   4      8         12         16   20   24
                                          >=3
3분 이내 응답의 빈도 분포 (하루 중 발화 시점 기준, 30분 간격 계측)
=2 group : 기상 직후, 점심, 저녁
>=3 group : 오전, 오후 업무 시간에 상대적 빈도 높다
                                                                                                <180
0.0500




0.0375




0.0250




0.0125




    0
         0:00   1:00   2:00   3:00   4:00   5:00   6:00   7:00   8:00   9:00    10:00   11:00    12:00   13:00   14:00   15:00   16:00   17:00   18:00   19:00   20:00   21:00   22:00   23:00
                                                                               =2                          >=3
3분 이상 1시간 이내 응답의 빈도 분포
 3분 이전과 큰 분포의 차이는 보이지 않는다.
                                                                                          >=3m <1h
0.0500




0.0375




0.0250




0.0125




    0
         0:00   1:00   2:00   3:00   4:00   5:00   6:00   7:00   8:00   9:00    10:00   11:00   12:00   13:00   14:00   15:00   16:00   17:00   18:00   19:00   20:00   21:00   22:00   23:00

                                                                               =2                         >=3
1시간 이상, 3시간 이내 응답의 빈도 분포
 오전 보다는 오후에 발화 비율이 높다.
 >=3 group 에서의 발화가 점심, 저녁 시간에 우위를 보이기 시작한다.

                                                                                           >=1h<3h
0.0500




0.0375




0.0250




0.0125




    0
         0:00   1:00   2:00   3:00   4:00   5:00   6:00   7:00   8:00   9:00    10:00   11:00   12:00   13:00   14:00   15:00   16:00   17:00   18:00   19:00   20:00   21:00   22:00   23:00

                                                                               =2                         >=3
1시간 이상, 3시간 이내 응답의 빈도 분포
오후 보다는 오전에 발화 비율이 높다.
그룹간 특정한 패턴 차이는 보이지 않는다.

                                                                                                >=3h
0.0500




0.0375




0.0250




0.0125




    0
         0:00   1:00   2:00   3:00   4:00   5:00   6:00   7:00   8:00   9:00    10:00   11:00    12:00   13:00   14:00   15:00   16:00   17:00   18:00   19:00   20:00   21:00   22:00   23:00
                                                                               =2                          >=3
=2 group 의 응답 시간, 응답 간격별 평균 발화 길이
 응답 간격이 커져도 (늦게 응답하게 되어도) 발화 길이에 큰 변화는 없다.

                                                                                         =2 길이
80




60




40




20




 0
     0:00   1:00   2:00   3:00   4:00   5:00   6:00   7:00   8:00   9:00   10:00   11:00   12:00   13:00   14:00   15:00   16:00   17:00   18:00   19:00   20:00   21:00   22:00   23:00

                                                                <3m                <1h             <3h             >=3h
>=3 group 의 응답 시간, 응답 간격별 평균 발화 길이
응답 간격이 커지면, 발화 길이가 두배 정도 길어진다.

                                                                                        >=3 길이
90.0




67.5




45.0




22.5




  0
       0:00   1:00   2:00   3:00   4:00   5:00   6:00   7:00   8:00   9:00   10:00   11:00   12:00   13:00   14:00   15:00   16:00   17:00   18:00   19:00   20:00   21:00   22:00   23:00

                                                                <3m             <1h              <3h                 >=3h
‘초대 받아 대화방에 참여하기는 했지만, 머뭇머뭇’

=2 group : 참여자 간에 최초 발화 시점 차이가 적다
>=3 group : 참여자 간에 최초 발화 시점 차이가 크다



                     =2 최초발화분포                                        >=3 최초발화분포
 300000                                          20000000




 225000                                          15000000




 150000                                          10000000




  75000                                          5000000




     0                                                 0
          0   37.5      75.0     112.5   150.0              0   150       300      450   600
Crossing Rate
사람들 모아놓고 왜 몇명만 이야기 할까? 를 수치화 하기 위한 값,

Crossing Value
둘이 이야기 하다가, 새로운 사람과 이야기 하게 되면 1
계속 둘이 이야기 하게 되면 0

CrossingRate = sum(CrossingValue) / 총 발화 횟수
CrossingRate 가 낮을 수록 두명의 참가자끼리만 대화한 빈도가 높음을 의미한다.

ex) A, B, C 가 이야기 할때,
A, B, C, A, B, C, A, B, C 이런 순서대로 대화하는 경우와
A, B, A, B, A,A, C, A, C 이런 순서대로 대화하는 경우 비교

                      발화자    Crossing Value     발화자    Crossing Value

                        A          0              A          0

                        B          0              B          0

                        C          1              A          0

                        A          1              B          0

                        B          1              C          1

                        C          1              A          1

                        A          1              B          1

                        B          1              A          0

                        C          1              B          0


                    Crossing Rate = 7/9       Crossing Rate = 3/9
=2 Group 에서는 2명의 참가자만 참여하므로, Crossing Rate 의 식을 변형하여 계산한다.
한 참가자가 계속해서 이야기 하면 Crossing Value 는 0, Turn-Taking 이 발생하면 1
이 경우 평균 Crossing Rate 는 0.55
>=3 Group 에서 평균 Crossing Rate 는 0.37,
이 값은 앞의 예제에서 보았듯이, A, B 가 9번 대화 중에 한번만 C 가 끼어들었을때 나올 수 있는 값이다. 따라서
타임라인에서 보았을때 A, B, C 사이에 대화 편중도는 더 크게 보일 것이다.


                                 Crossing Rate 비교
                0.60




                0.45




                0.30




                0.15




                  0

                            =2                  >=3
>=3 Group 각 방의 Crossing Rate
참가자 수가 많아질 수록 Crossing Rate 는 상승한다. 이는 당연하다.
3명 방에서 Crossing Rate 는 0.2 에 미치지 못한다. 예상보다 대화 편중도가 심각하다는 의미다.

Crossing Rate 가 높은 경우들이 있다. 7명 0.75, 19명 0.82, 하지만 이 경우 모두 대화가 매우 짧게 수집된 경우이
다. 처음 방이 개설되고 서로 인사할 때에는 Crossing Rate 가 높지만, 대화가 계속될 수록 몇명의 참여자, 특히 한
시점에는 두명의 참가자 만이 대화하는 경우가 많아져, Crossing Rate 가 떨어진다.




                                                            >=3 Crossing Rate
            0.900




            0.675




            0.450




            0.225




               0
                    3   3   3   3   3   3   4   4   4   5   5   5   5   6    7   8   9   11   12   15   16   20   21   26   34

                                                             Crossing Rate
=2 Group 의 TurnTaking (발화자 변경) 간격
>=3 Group 의 Crossing (발화-pair 변경) 간격 평균 비교

=2 Group 에서는 1분 이내 간격에 집중되지만,
>=3 Group 에서 보다 넓은 범위에서 Crossing 이 발견되고 있다.

                                                                     TurnTaking 간격
           0.4




           0.3




           0.2




           0.1




            0
                 0:00 0:04 0:08 0:12 0:16 0:20 0:24 0:28 0:32 0:36 0:40 0:44 0:48 0:52 0:56 1:00 5:00 9:00 13:00 17:00 21:00 0:00 0:00 0:00
                                                                =2                       >=3
=2 개별 Group 의 TurnTaking (발화자 변경) 간격

1분 이내 구간에 치중된 양상을 보인다.




                                                                            =2 개별 TurnTaking 빈도




                                                                                                                                  0.700



                                                                                                                                 0.525


                                                                                                                                 0.350


                                                                                                                             0.175


                                                                                                                             0




               0:00 0:06
                         0:12
                                0:18
                                       0:24
                                              0:30
                                                     0:36
                                                            0:42
                                                                   0:48
                                                                          0:54
                                                                                 1:00
                                                                                        7:00
                                                                                               13:00
                                                                                                       19:00
                                                                                                               0:00
                                                                                                                      0:00
>=3 개별 Group 의 Crossing (발화-pair 변경) 간격

1분 이내 구간에도 많이 분포하지만, 2 과 비교하면, 이후 구간에서 훨씬 많은 발화자 변경이 보인다.

바꾸어 발하면,
3명 이상 모인 대화방에서 둘만 이야기한 구간이 수십분, 한시간을 넘어서는 구간이 아래 그래프에서 삐죽 튀어
나온 부분 많큼 많다는 것이다.

                                                                            >=3 개별 TurnTaking 빈도




                                                                                                                                   0.60



                                                                                                                                  0.45



                                                                                                                                  0.30


                                                                                                                              0.15


                                                                                                                              0




                0:00 0:06
                            0:12
                                   0:18 0:24
                                               0:30
                                                      0:36
                                                             0:42
                                                                    0:48
                                                                           0:54
                                                                                  1:00
                                                                                         7:00
                                                                                                13:00
                                                                                                        19:00
                                                                                                                0:00
                                                                                                                       0:00
대화 내용을 보다 보면 3인 이상 그룹 방의 시간은 천천히 흐르는 느낌이 있었다.

2인 대화에서는 한시간만 늦게 응답하게 되어도 미안하다고 하지만,
3인 대화에서는 그런 느낌의 발화 내용을 찾기 힘들다.

이러한 느낌을 수치화 하기 위해 찾은 지표로 [이모티콘 연쇄] 를 측정해보았다.

이모티콘은 감정등의 비언어적 커뮤니케이션 전달 목적으로 사용된다.
특히 상대의 이모티콘에 연달아 이모티콘을 사용하는 행위는 상대의 느낌, 감정 등에 동조하는 행위로 즉각적인
반응이 아니라면 어색해질 수 있다.
‘ㅋㅋ’, => ‘ㅋㅋ’,
‘사랑해’, => ‘나도’ 이런 느낌의 대화를 한시간 뒤에 이어간다고 생각했을때의 어색함이 그것이다.

다만, 이모티콘의 활용 빈도는 참여자의 이모티콘 리터러시에 의하므로 대화방마다 편차가 크다.
이에, 모든 그룹을 평균내기 보다는 이모티콘 활용 빈도가 높은 대화방을 중심으로 비교하였다.
2 group 방 (a, b)
25 group 방 (a), 34 group 방 (b) 등에서 이모티콘 연쇄가 일어났을때 시점 분포를 아래와 같이 그려보았다.
25, 34 group 방에서 이모티콘 연쇄가 상대적으로 늦고,
한시간을 넘어 호응하는 연쇄가 발생하는 경우도 적지 않음이 보인다.



                                                                                이모티콘 연쇄 비교
 0.900




 0.675




 0.450




 0.225




    0
         0:00 0:03 0:06 0:09 0:12 0:15 0:18 0:21 0:24 0:27 0:30 0:33 0:36 0:39 0:42 0:45 0:48 0:51 0:54 0:57 1:00 4:00 7:00 10:00 13:00 16:00 19:00 22:00 0:00 0:00 0:00
                                                              =2 a            >=3 a           >=3 b            =2 b
unigram (1-gram) 빈도 측정

대화 내용을 보며, 이모티콘, 죄송, 안녕, 등의 자주 쓰이는 단어들이 있음을 발견했고,
또한 이러한 단어들이 참여자 수에 따라 다르게 쓰일 수 있을 것이라는 생각을 했다.

이에 gram 을 space 로 나누어진 단어로 정의하고, 모든 대화 내용에 대해 중복되는 gram 빈도 계산을 했다.
그 결과에서 100회 이상 중복된 gram 을 추출하고, 유사 의미에 따라 다음과 같이 묶었다.
['굿모닝', '안녕'], #환영
['잘가', '바이', '빠이'], #배웅
['내가', '난', '나도', '나는', '저도', '제가', '저는', '나의', '나랑', '누가', '나두'], # 나
['니가', '너가', '너도'], # 너
['우리','다들','같이', '여러분', '우리가', '우린', '모두', '함께'], # 우리
['오빠', '언니', '사람', '오빠가', '사람이'], # 3인칭
['그거', '그게', '그건', '저거', '거기', '그런'], # 그거
['이거', '여기', '이건', '이게', '이런거'], # 이거
['이제', '지금', '오늘', '요즘', '오늘은', '지금은', '맨날', '방금'], #현재
['내일', '나중에', '이번주'],# 미래
['어제', '아까', '전에', '그때'], #과거
['계속', '바로', '빨리', '이미', '곧', '거의', '일찍', '갑자기', '또', '다시', '자꾸', '시간'], #시간 빈도
['천천', '늦'], # 천천
['너무', '존나', '많이', '넘', '젤', '엄청', '얼마나', '잘', '진'], #정도 많이
['하나', '한번', '혼자', '딱', '조금'], # 정도 조금
['고마', '고맙', '감사', '좋'], #긍정
['미안', '죄송', '지송', '싫'], #부정
['보고', '가서', '하면', '먹고', '하는', '연락'], # 동사
['그래서', '그리고', '일단', '이렇게', '그렇게', '글고'], # 순접
['그래도', '못', '하지만', '사실', '아니면'], # 역접
['어디서', '언제', '왜', '어떤', '뭔가', '어떻게', '무슨', '혹시', '아마', '왜'], # 의문
['그럼', '응', '웅', '완전', '그래', '네', '있는', '꼭', '역시', '원래', '있는데', '좋은', '있음', '있다', '같은', '그니까', '같아'], #긍정
['근데', '아니', '아님', '정말', '몰라', '아니라', '다른'], # 부정
['오오', '우와', '대박'], # 긍정 호응
['헐', '좀', '걍', '그냥', '헉', '졸라', '흑흑', '힝', 'ㅠ', 'ㅜ'], # 부정 호응
['ㅇ', 'ㅋ', 'ㅎ', '*', '_', '^'], # 웃음 이모티콘
[';', '!', '?', 'ㅡ'] # 문장 부호
unigram (1-gram) 빈도 측정

이렇게 묶은 gram 들의 발생 빈도를, =2 group, >=3 group 에서 각각 측정하고 차이를 비교했다.
그 결과 의미 있는 차이를 보인 gram category 는 아래와 같다.
['굿모닝', '안녕'], #환영
['잘가', '바이', '빠이'], #배웅

(현재, 미래) = 동일
['어제', '아까', '전에', '그때'], #과거

(정도 많이) = 동일
['하나', '한번', '혼자', '딱', '조금'], # 정도 조금

(긍정) = 동일
['미안', '죄송', '지송', '싫'], #부정

['그래서', '그리고', '일단', '이렇게', '그렇게', '글고'], # 순접
['그래도', '못', '하지만', '사실', '아니면'], # 역접

['어디서', '언제', '왜', '어떤', '뭔가', '어떻게', '무슨', '혹시', '아마', '왜'], # 의문

['오오', '우와', '대박'], # 긍정 호응
(부정 호응, 웃음) = 동일


위의 카테고리를 제외한 gram 들의 발생 빈도는 =2, >=3 group 에서 유사하게 나타난다.
하지만, =2, >=3 group 에서 발화 빈도에는 차이가 있다. 따라서 위의 gram 들이 그 차이의 흔적이라 생각할 수 있
다.
이러한 양상은, 참가자가 2인 대화 처럼 발화하기도 하지만,
발화 내용에 따라 다수의 다른 참여자를 감안하여 발화하기도 한다는 것을 보여준다.
안녕
0.700




0.525




0.350




0.175




   0
   무제 1   무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91

                               =2 a        =2 b        >=3 a        >=3 b
안녕
0.4




0.3




0.2




0.1




 0
 무제 1   무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91

                                       =2                  >=3
잘가
0.60




0.45




0.30




0.15




  0
  무제 1   무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91

                                       =2                  >=3
어제
0.60




0.45




0.30




0.15




  0
  무제 1   무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91


                                       =2                  >=2
한번
0.60




0.45




0.30




0.15




  0
  무제 1   무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91

                                       =2                  >=3
미안
0.500




0.375




0.250




0.125




   0
   무제 1   무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91

                                        =2                  >=3
그래서
0.60




0.45




0.30




0.15




  0
  무제 1   무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91
                                       =2                  >=3
그래도
0.60




0.45




0.30




0.15




  0
  무제 1   무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91


                                       =2                  >=3
어디서
0.60




0.45




0.30




0.15




  0
  무제 1   무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91

                                       =2                  >=2
오오
0.60




0.45




0.30




0.15




  0
  무제 1   무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91

                                       =2                  >=3

Weitere ähnliche Inhalte

Mehr von Jaehyeuk Oh

20111213 여행의 실패와 상호작용을 통한 극복
20111213 여행의 실패와 상호작용을 통한 극복20111213 여행의 실패와 상호작용을 통한 극복
20111213 여행의 실패와 상호작용을 통한 극복
Jaehyeuk Oh
 
Tourist Interaction
Tourist InteractionTourist Interaction
Tourist Interaction
Jaehyeuk Oh
 
20111201 많아지면 달라진다
20111201 많아지면 달라진다20111201 많아지면 달라진다
20111201 많아지면 달라진다
Jaehyeuk Oh
 
20111124 현대세계의일상성 오재혁
20111124 현대세계의일상성 오재혁20111124 현대세계의일상성 오재혁
20111124 현대세계의일상성 오재혁
Jaehyeuk Oh
 
20111027 연습여행기록
20111027 연습여행기록20111027 연습여행기록
20111027 연습여행기록
Jaehyeuk Oh
 
20111018 여행연구계획 2
20111018 여행연구계획 220111018 여행연구계획 2
20111018 여행연구계획 2
Jaehyeuk Oh
 
20111018 여행연구계획 2
20111018 여행연구계획 220111018 여행연구계획 2
20111018 여행연구계획 2
Jaehyeuk Oh
 
20111014 여행연구계획
20111014 여행연구계획20111014 여행연구계획
20111014 여행연구계획
Jaehyeuk Oh
 
20111014 시체공시소
20111014 시체공시소20111014 시체공시소
20111014 시체공시소
Jaehyeuk Oh
 
20111013 시체공시소
20111013 시체공시소20111013 시체공시소
20111013 시체공시소
Jaehyeuk Oh
 
20111006 여행관찰계획 오재혁
20111006 여행관찰계획 오재혁20111006 여행관찰계획 오재혁
20111006 여행관찰계획 오재혁
Jaehyeuk Oh
 
오재혁 랩미팅 발제 20110810
오재혁 랩미팅 발제 20110810오재혁 랩미팅 발제 20110810
오재혁 랩미팅 발제 20110810
Jaehyeuk Oh
 
Transmedia narrative
Transmedia narrativeTransmedia narrative
Transmedia narrative
Jaehyeuk Oh
 
SNS Reader for the impaired
SNS Reader for the impairedSNS Reader for the impaired
SNS Reader for the impaired
Jaehyeuk Oh
 
20110616 government
20110616 government20110616 government
20110616 government
Jaehyeuk Oh
 
오재혁 Olpc tech #2
오재혁 Olpc tech #2오재혁 Olpc tech #2
오재혁 Olpc tech #2
Jaehyeuk Oh
 
Interface mattersrev
Interface mattersrevInterface mattersrev
Interface mattersrev
Jaehyeuk Oh
 
20110421 디지털모자이크
20110421 디지털모자이크20110421 디지털모자이크
20110421 디지털모자이크
Jaehyeuk Oh
 

Mehr von Jaehyeuk Oh (20)

20111213 여행의 실패와 상호작용을 통한 극복
20111213 여행의 실패와 상호작용을 통한 극복20111213 여행의 실패와 상호작용을 통한 극복
20111213 여행의 실패와 상호작용을 통한 극복
 
Tourist Interaction
Tourist InteractionTourist Interaction
Tourist Interaction
 
20111201 많아지면 달라진다
20111201 많아지면 달라진다20111201 많아지면 달라진다
20111201 많아지면 달라진다
 
20111124 현대세계의일상성 오재혁
20111124 현대세계의일상성 오재혁20111124 현대세계의일상성 오재혁
20111124 현대세계의일상성 오재혁
 
20111027 연습여행기록
20111027 연습여행기록20111027 연습여행기록
20111027 연습여행기록
 
20111018 여행연구계획 2
20111018 여행연구계획 220111018 여행연구계획 2
20111018 여행연구계획 2
 
20111018 여행연구계획 2
20111018 여행연구계획 220111018 여행연구계획 2
20111018 여행연구계획 2
 
20111014 여행연구계획
20111014 여행연구계획20111014 여행연구계획
20111014 여행연구계획
 
20111014 시체공시소
20111014 시체공시소20111014 시체공시소
20111014 시체공시소
 
20111013 시체공시소
20111013 시체공시소20111013 시체공시소
20111013 시체공시소
 
20111006 여행관찰계획 오재혁
20111006 여행관찰계획 오재혁20111006 여행관찰계획 오재혁
20111006 여행관찰계획 오재혁
 
여행? 경험,
여행? 경험,여행? 경험,
여행? 경험,
 
오재혁 랩미팅 발제 20110810
오재혁 랩미팅 발제 20110810오재혁 랩미팅 발제 20110810
오재혁 랩미팅 발제 20110810
 
Transmedia narrative
Transmedia narrativeTransmedia narrative
Transmedia narrative
 
SNS Reader for the impaired
SNS Reader for the impairedSNS Reader for the impaired
SNS Reader for the impaired
 
20110616 government
20110616 government20110616 government
20110616 government
 
GOVERNMENT
GOVERNMENTGOVERNMENT
GOVERNMENT
 
오재혁 Olpc tech #2
오재혁 Olpc tech #2오재혁 Olpc tech #2
오재혁 Olpc tech #2
 
Interface mattersrev
Interface mattersrevInterface mattersrev
Interface mattersrev
 
20110421 디지털모자이크
20110421 디지털모자이크20110421 디지털모자이크
20110421 디지털모자이크
 

Mobile Messenger 대화 분석 결과

  • 1. [MIM 대화 분석] 데이터 개요 데이터 특성 2 group >=3 group 총계 35개 49개 총 발화 횟수 63177 회 70584 회 분석 방법 1. 전반적인 발화 간격 측정 2. 대화방 참여 후 첫 발화까지의 시간 측정 3. 발화 순서 (Crossing Ratio) 측정 4. 이모티콘 연쇄 빈도 측정 5. 1-gram 빈도 측정 이 분석은 융합기술대학원 사용자경험연구실 오재혁연구원에 의해 수행되었습니다. (email : return2music@gmail.com, facebook:http://www.facebook.com/jaehyeuk) 실험 어플리케이션 페이지 : http://ix.snu.ac.kr/~iot/ms/index.html 실펌 페이스북 페이지 : http://www.facebook.com/WhoisFreerider
  • 2. 발화 간격 : 바로 이어진 발화 사이의 시간 간격 =2 group : 1분 이내 발화가 많다. >=3 group : 전반적으로 2 group 보다 1분을 넘는 발화 간격의 빈도가 높다. 발화 간격 빈도 변화량 (기울기) 의 변화를 보았을때, 1분,3분, 1시간,3시간 에서 변화 정도에 특이점이 있다. 위 시점을 기준으로 발화 양상에 차이가 있을 수 있다고 가정하고 다음의 분석을 진행했 다. =2 >=3 발화간격빈도비교 0.0500 0.0375 0.0250 0.0125 0 2 5 8 11 14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 3 6 9 12 15 18 21 1day 4 7 10 =2 >=3
  • 3. 앞의 분석에서 한시간을 넘는 발화 간격이 적지 않음을 보았기에, 이러한 늦은 응답이 어떻게 일어나는지 보고자 했다. 이 그래프의 X 축은 직전 발화의 시각 Y 축은 그 발화에 응답하여 이루어진 발화의 시각이다. 파란색은 3인 이상, 녹색은 2인 그룹의 발화 패턴이다. 이 그래프에서 =2, >=3 Group 간 차이는 >=3, =2, 1시간초과발화 시점비교 보이지 않는다. 24 20 16 12 자고 일어나서 응답하는 패턴 8 일과 시간에 조금 늦게 응답하는 패턴 4 0 0 4 8 12 16 20 24 >=3
  • 4. 3분 이내 응답의 빈도 분포 (하루 중 발화 시점 기준, 30분 간격 계측) =2 group : 기상 직후, 점심, 저녁 >=3 group : 오전, 오후 업무 시간에 상대적 빈도 높다 <180 0.0500 0.0375 0.0250 0.0125 0 0:00 1:00 2:00 3:00 4:00 5:00 6:00 7:00 8:00 9:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 =2 >=3
  • 5. 3분 이상 1시간 이내 응답의 빈도 분포 3분 이전과 큰 분포의 차이는 보이지 않는다. >=3m <1h 0.0500 0.0375 0.0250 0.0125 0 0:00 1:00 2:00 3:00 4:00 5:00 6:00 7:00 8:00 9:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 =2 >=3
  • 6. 1시간 이상, 3시간 이내 응답의 빈도 분포 오전 보다는 오후에 발화 비율이 높다. >=3 group 에서의 발화가 점심, 저녁 시간에 우위를 보이기 시작한다. >=1h<3h 0.0500 0.0375 0.0250 0.0125 0 0:00 1:00 2:00 3:00 4:00 5:00 6:00 7:00 8:00 9:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 =2 >=3
  • 7. 1시간 이상, 3시간 이내 응답의 빈도 분포 오후 보다는 오전에 발화 비율이 높다. 그룹간 특정한 패턴 차이는 보이지 않는다. >=3h 0.0500 0.0375 0.0250 0.0125 0 0:00 1:00 2:00 3:00 4:00 5:00 6:00 7:00 8:00 9:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 =2 >=3
  • 8. =2 group 의 응답 시간, 응답 간격별 평균 발화 길이 응답 간격이 커져도 (늦게 응답하게 되어도) 발화 길이에 큰 변화는 없다. =2 길이 80 60 40 20 0 0:00 1:00 2:00 3:00 4:00 5:00 6:00 7:00 8:00 9:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 <3m <1h <3h >=3h
  • 9. >=3 group 의 응답 시간, 응답 간격별 평균 발화 길이 응답 간격이 커지면, 발화 길이가 두배 정도 길어진다. >=3 길이 90.0 67.5 45.0 22.5 0 0:00 1:00 2:00 3:00 4:00 5:00 6:00 7:00 8:00 9:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 <3m <1h <3h >=3h
  • 10. ‘초대 받아 대화방에 참여하기는 했지만, 머뭇머뭇’ =2 group : 참여자 간에 최초 발화 시점 차이가 적다 >=3 group : 참여자 간에 최초 발화 시점 차이가 크다 =2 최초발화분포 >=3 최초발화분포 300000 20000000 225000 15000000 150000 10000000 75000 5000000 0 0 0 37.5 75.0 112.5 150.0 0 150 300 450 600
  • 11. Crossing Rate 사람들 모아놓고 왜 몇명만 이야기 할까? 를 수치화 하기 위한 값, Crossing Value 둘이 이야기 하다가, 새로운 사람과 이야기 하게 되면 1 계속 둘이 이야기 하게 되면 0 CrossingRate = sum(CrossingValue) / 총 발화 횟수 CrossingRate 가 낮을 수록 두명의 참가자끼리만 대화한 빈도가 높음을 의미한다. ex) A, B, C 가 이야기 할때, A, B, C, A, B, C, A, B, C 이런 순서대로 대화하는 경우와 A, B, A, B, A,A, C, A, C 이런 순서대로 대화하는 경우 비교 발화자 Crossing Value 발화자 Crossing Value A 0 A 0 B 0 B 0 C 1 A 0 A 1 B 0 B 1 C 1 C 1 A 1 A 1 B 1 B 1 A 0 C 1 B 0 Crossing Rate = 7/9 Crossing Rate = 3/9
  • 12. =2 Group 에서는 2명의 참가자만 참여하므로, Crossing Rate 의 식을 변형하여 계산한다. 한 참가자가 계속해서 이야기 하면 Crossing Value 는 0, Turn-Taking 이 발생하면 1 이 경우 평균 Crossing Rate 는 0.55 >=3 Group 에서 평균 Crossing Rate 는 0.37, 이 값은 앞의 예제에서 보았듯이, A, B 가 9번 대화 중에 한번만 C 가 끼어들었을때 나올 수 있는 값이다. 따라서 타임라인에서 보았을때 A, B, C 사이에 대화 편중도는 더 크게 보일 것이다. Crossing Rate 비교 0.60 0.45 0.30 0.15 0 =2 >=3
  • 13. >=3 Group 각 방의 Crossing Rate 참가자 수가 많아질 수록 Crossing Rate 는 상승한다. 이는 당연하다. 3명 방에서 Crossing Rate 는 0.2 에 미치지 못한다. 예상보다 대화 편중도가 심각하다는 의미다. Crossing Rate 가 높은 경우들이 있다. 7명 0.75, 19명 0.82, 하지만 이 경우 모두 대화가 매우 짧게 수집된 경우이 다. 처음 방이 개설되고 서로 인사할 때에는 Crossing Rate 가 높지만, 대화가 계속될 수록 몇명의 참여자, 특히 한 시점에는 두명의 참가자 만이 대화하는 경우가 많아져, Crossing Rate 가 떨어진다. >=3 Crossing Rate 0.900 0.675 0.450 0.225 0 3 3 3 3 3 3 4 4 4 5 5 5 5 6 7 8 9 11 12 15 16 20 21 26 34 Crossing Rate
  • 14. =2 Group 의 TurnTaking (발화자 변경) 간격 >=3 Group 의 Crossing (발화-pair 변경) 간격 평균 비교 =2 Group 에서는 1분 이내 간격에 집중되지만, >=3 Group 에서 보다 넓은 범위에서 Crossing 이 발견되고 있다. TurnTaking 간격 0.4 0.3 0.2 0.1 0 0:00 0:04 0:08 0:12 0:16 0:20 0:24 0:28 0:32 0:36 0:40 0:44 0:48 0:52 0:56 1:00 5:00 9:00 13:00 17:00 21:00 0:00 0:00 0:00 =2 >=3
  • 15. =2 개별 Group 의 TurnTaking (발화자 변경) 간격 1분 이내 구간에 치중된 양상을 보인다. =2 개별 TurnTaking 빈도 0.700 0.525 0.350 0.175 0 0:00 0:06 0:12 0:18 0:24 0:30 0:36 0:42 0:48 0:54 1:00 7:00 13:00 19:00 0:00 0:00
  • 16. >=3 개별 Group 의 Crossing (발화-pair 변경) 간격 1분 이내 구간에도 많이 분포하지만, 2 과 비교하면, 이후 구간에서 훨씬 많은 발화자 변경이 보인다. 바꾸어 발하면, 3명 이상 모인 대화방에서 둘만 이야기한 구간이 수십분, 한시간을 넘어서는 구간이 아래 그래프에서 삐죽 튀어 나온 부분 많큼 많다는 것이다. >=3 개별 TurnTaking 빈도 0.60 0.45 0.30 0.15 0 0:00 0:06 0:12 0:18 0:24 0:30 0:36 0:42 0:48 0:54 1:00 7:00 13:00 19:00 0:00 0:00
  • 17. 대화 내용을 보다 보면 3인 이상 그룹 방의 시간은 천천히 흐르는 느낌이 있었다. 2인 대화에서는 한시간만 늦게 응답하게 되어도 미안하다고 하지만, 3인 대화에서는 그런 느낌의 발화 내용을 찾기 힘들다. 이러한 느낌을 수치화 하기 위해 찾은 지표로 [이모티콘 연쇄] 를 측정해보았다. 이모티콘은 감정등의 비언어적 커뮤니케이션 전달 목적으로 사용된다. 특히 상대의 이모티콘에 연달아 이모티콘을 사용하는 행위는 상대의 느낌, 감정 등에 동조하는 행위로 즉각적인 반응이 아니라면 어색해질 수 있다. ‘ㅋㅋ’, => ‘ㅋㅋ’, ‘사랑해’, => ‘나도’ 이런 느낌의 대화를 한시간 뒤에 이어간다고 생각했을때의 어색함이 그것이다. 다만, 이모티콘의 활용 빈도는 참여자의 이모티콘 리터러시에 의하므로 대화방마다 편차가 크다. 이에, 모든 그룹을 평균내기 보다는 이모티콘 활용 빈도가 높은 대화방을 중심으로 비교하였다.
  • 18. 2 group 방 (a, b) 25 group 방 (a), 34 group 방 (b) 등에서 이모티콘 연쇄가 일어났을때 시점 분포를 아래와 같이 그려보았다. 25, 34 group 방에서 이모티콘 연쇄가 상대적으로 늦고, 한시간을 넘어 호응하는 연쇄가 발생하는 경우도 적지 않음이 보인다. 이모티콘 연쇄 비교 0.900 0.675 0.450 0.225 0 0:00 0:03 0:06 0:09 0:12 0:15 0:18 0:21 0:24 0:27 0:30 0:33 0:36 0:39 0:42 0:45 0:48 0:51 0:54 0:57 1:00 4:00 7:00 10:00 13:00 16:00 19:00 22:00 0:00 0:00 0:00 =2 a >=3 a >=3 b =2 b
  • 19. unigram (1-gram) 빈도 측정 대화 내용을 보며, 이모티콘, 죄송, 안녕, 등의 자주 쓰이는 단어들이 있음을 발견했고, 또한 이러한 단어들이 참여자 수에 따라 다르게 쓰일 수 있을 것이라는 생각을 했다. 이에 gram 을 space 로 나누어진 단어로 정의하고, 모든 대화 내용에 대해 중복되는 gram 빈도 계산을 했다. 그 결과에서 100회 이상 중복된 gram 을 추출하고, 유사 의미에 따라 다음과 같이 묶었다. ['굿모닝', '안녕'], #환영 ['잘가', '바이', '빠이'], #배웅 ['내가', '난', '나도', '나는', '저도', '제가', '저는', '나의', '나랑', '누가', '나두'], # 나 ['니가', '너가', '너도'], # 너 ['우리','다들','같이', '여러분', '우리가', '우린', '모두', '함께'], # 우리 ['오빠', '언니', '사람', '오빠가', '사람이'], # 3인칭 ['그거', '그게', '그건', '저거', '거기', '그런'], # 그거 ['이거', '여기', '이건', '이게', '이런거'], # 이거 ['이제', '지금', '오늘', '요즘', '오늘은', '지금은', '맨날', '방금'], #현재 ['내일', '나중에', '이번주'],# 미래 ['어제', '아까', '전에', '그때'], #과거 ['계속', '바로', '빨리', '이미', '곧', '거의', '일찍', '갑자기', '또', '다시', '자꾸', '시간'], #시간 빈도 ['천천', '늦'], # 천천 ['너무', '존나', '많이', '넘', '젤', '엄청', '얼마나', '잘', '진'], #정도 많이 ['하나', '한번', '혼자', '딱', '조금'], # 정도 조금 ['고마', '고맙', '감사', '좋'], #긍정 ['미안', '죄송', '지송', '싫'], #부정 ['보고', '가서', '하면', '먹고', '하는', '연락'], # 동사 ['그래서', '그리고', '일단', '이렇게', '그렇게', '글고'], # 순접 ['그래도', '못', '하지만', '사실', '아니면'], # 역접 ['어디서', '언제', '왜', '어떤', '뭔가', '어떻게', '무슨', '혹시', '아마', '왜'], # 의문 ['그럼', '응', '웅', '완전', '그래', '네', '있는', '꼭', '역시', '원래', '있는데', '좋은', '있음', '있다', '같은', '그니까', '같아'], #긍정 ['근데', '아니', '아님', '정말', '몰라', '아니라', '다른'], # 부정 ['오오', '우와', '대박'], # 긍정 호응 ['헐', '좀', '걍', '그냥', '헉', '졸라', '흑흑', '힝', 'ㅠ', 'ㅜ'], # 부정 호응 ['ㅇ', 'ㅋ', 'ㅎ', '*', '_', '^'], # 웃음 이모티콘 [';', '!', '?', 'ㅡ'] # 문장 부호
  • 20. unigram (1-gram) 빈도 측정 이렇게 묶은 gram 들의 발생 빈도를, =2 group, >=3 group 에서 각각 측정하고 차이를 비교했다. 그 결과 의미 있는 차이를 보인 gram category 는 아래와 같다. ['굿모닝', '안녕'], #환영 ['잘가', '바이', '빠이'], #배웅 (현재, 미래) = 동일 ['어제', '아까', '전에', '그때'], #과거 (정도 많이) = 동일 ['하나', '한번', '혼자', '딱', '조금'], # 정도 조금 (긍정) = 동일 ['미안', '죄송', '지송', '싫'], #부정 ['그래서', '그리고', '일단', '이렇게', '그렇게', '글고'], # 순접 ['그래도', '못', '하지만', '사실', '아니면'], # 역접 ['어디서', '언제', '왜', '어떤', '뭔가', '어떻게', '무슨', '혹시', '아마', '왜'], # 의문 ['오오', '우와', '대박'], # 긍정 호응 (부정 호응, 웃음) = 동일 위의 카테고리를 제외한 gram 들의 발생 빈도는 =2, >=3 group 에서 유사하게 나타난다. 하지만, =2, >=3 group 에서 발화 빈도에는 차이가 있다. 따라서 위의 gram 들이 그 차이의 흔적이라 생각할 수 있 다. 이러한 양상은, 참가자가 2인 대화 처럼 발화하기도 하지만, 발화 내용에 따라 다수의 다른 참여자를 감안하여 발화하기도 한다는 것을 보여준다.
  • 21. 안녕 0.700 0.525 0.350 0.175 0 무제 1 무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91 =2 a =2 b >=3 a >=3 b
  • 22. 안녕 0.4 0.3 0.2 0.1 0 무제 1 무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91 =2 >=3
  • 23. 잘가 0.60 0.45 0.30 0.15 0 무제 1 무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91 =2 >=3
  • 24. 어제 0.60 0.45 0.30 0.15 0 무제 1 무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91 =2 >=2
  • 25. 한번 0.60 0.45 0.30 0.15 0 무제 1 무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91 =2 >=3
  • 26. 미안 0.500 0.375 0.250 0.125 0 무제 1 무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91 =2 >=3
  • 27. 그래서 0.60 0.45 0.30 0.15 0 무제 1 무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91 =2 >=3
  • 28. 그래도 0.60 0.45 0.30 0.15 0 무제 1 무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91 =2 >=3
  • 29. 어디서 0.60 0.45 0.30 0.15 0 무제 1 무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91 =2 >=2
  • 30. 오오 0.60 0.45 0.30 0.15 0 무제 1 무제 7 무제 13 무제 19 무제 25 무제 31 무제 37 무제 43 무제 49 무제 55 무제 61 무제 67 무제 73 무제 79 무제 85 무제 91 =2 >=3