iTech Bridge

Welcome Guest ( Log In | Register )

 
Reply to this topicStart new topic
> От каждого по способности, каждому по труду, Как нам обустроить социальный веб? (3)
amilner
post Jul 25 2007, 06:04 PM
Post #1


iTech Bridge's Editor
***

Group: Admin
Posts: 468
Joined: 23-May 06
Member No.: 94



В предыдущей заметке серии «Как нам обустроить...» мы рассмотрели инструментарий, с помощью которого каждый зарегистрированный пользователь может выразить своё отношение к различным входным сообщениям, поступающих от других пользователей. В этой остановимся на том для чего, как, когда, и в какой степени при ранжировании информации и пользователей система (ресурс, ИСР) должна использовать, проставленные оценки. Попутно, но очень поверхностно, мы здесь иногда будем затрагивать некоторые вопросы, связанные с отображением результатов ранжирования на выходе системы. Подробнее эти вопросы планируется разобрать в специальной заметке. Напомню ещё раз, что, мы договорились пока рассматривать только «чистые» сообщения. О реакции системы на пометки «Грязь» и «Что-то не так» речь будет также идти в отдельной заметке.

О чём речь


В общем случае, процедурам ранжирования в социальных ресурсах подвергаются объекты трёх типов:
1. Основные сообщения (темы/topics)
2. Пользователи
3. Сайты (ресурсы – источники информации)

В качестве исходной информацией для ранжирования при этом могут выступать:

1. Прямые пользовательские оценки:
- данного объекта, например, как мы это видели в предыдущей заметке применительно к сообщениям
- другого объекта, например, сообщения при оценке его автора
2. Косвенные действия пользователей, которые могут что-то сказать об интересе к ранжируемому объекту

А теперь рассмотрим всё это конкретнее применительно к каждому из трёх видов объектов ранжирования. Как всегда, сначала будем говорить о существующих ресурсах, а затем о том, что предлагается для типового интеллигентного социального ресурса (ИСР). При этом хочу сразу предупредить, что, говоря о существующих ресурсах и в некоторых случаях не зная точных алгоритмов их работы, я буду опираться на свои наблюдения. Непрозрачность алгоритмов ранжирования – это вопрос отдельного разговора

Ранжирование основных сообщений


Ранг сообщения в существующих ресурсах определяется как:

digg – некоторая функция от сумм всех пользовательских «за (digg it) и «против» (Bury) по отношению к данному сообщению. Такая интегральная оценка здесь называется Популярностью сообщения.

reddit - некоторая функция от сумм всех пользовательских «за (Up/like) и «против» (Down/dislike) по отношению к данному сообщению. Однако такая функция рассматривается здесь только как один из вариантов ранжирования. Почти на равных используются и другие, например, по «противоречивости» (Controversy) и актуальности (Hot)

news2 – некоторая функция от сумм всех пользовательских «за (Отметить) и «против» (Проблема?) по отношению к данному сообщению. Такая интегральная оценка здесь называется Качеством сообщения.

habrahabr – некоторая функция от сумм всех пользовательских «за и «против» по отношению к данному сообщению. Такая интегральная оценка здесь называется Хабрасилой

del.icio.us – некоторая функция от сумм всех пользовательских «за (save it) по отношению к данному сообщению. Такая интегральная оценка здесь называется Популярностью сообщения.

bobrdobr.ru - ранжирование сообщений не используется (или мне так показалось?)

У меня есть подозрение, что на значения аргументов типа «за» и «против» в некоторых ресурсах также влияют ранги голосующих пользователей. Также думаю, что иногда на значение такого весового коэффициента влияет и сумма комментариев к данному сообщению. С большей вероятностью последнее предположение верно для reddit при ранжировании по «противоречивости» и актуальности.

Предлагается для ИСР:

1. Ранжирование по номинациям - многокритериальное ранжирование
2. Равноправность всех номинаций – пользователь сам выбирает, какая номинация его больше устраивает и даже может соотнести такую номинацию со своей домашней страницей
3. Актуальность сообщения является самой «объективной» номинацией для сообщений, хотя рассматривается системой только как первая среди равных. Именно по критерию актуальности ранжируются сообщения, выдаваемые на главную страницу по умалчиванию. Как мы увидим дальше - этот же критерий является основным (если не единственным), используемым при ранжировании пользователей.
4. Равноправность «оценивающих» пользователей в части возможности высказать свою оценку любого сообщения (не своего, конечно). Что касается весовых коэффициентов такой оценки, то статус голосующего в определённых случаях может оказать влияние на такой весовой коэффициент. Но этому планируется посвятить отдельный разговор.

Сформулированный подход, с моей точки зрения, является гарантией высокого уровню плюрализма ИСР и предотвращает возможность когда либо некоторой группе пользователей навязывать свои «идеологические» пристрастия остальным.

Сначала несколько слов о номинациях ранжирования основных сообщений, каждая из которых связана со своим критерием. Вообще говоря, их может быть сколь угодно много. Я приведу только несколько (названия условные; как и номенклатура номинаций, это дело вкуса разработчиков ИРС):

- Актуальность (популярность, востребованность) сообщений – как мы уже отметили, это основной критерий. Поэтому, с моей точки зрения, он является обязательным для любой ИРС. Подробнее об этой номинации смотри ниже.
- Общепризнанность сообщений – содержат идеи (мысли, предложения, выводы), с которыми согласны большинство ознакомивших с ними
- Неприемлемость сообщений - содержат идеи (мысли, предложения, выводы), с которыми не согласны большинство ознакомивших с ними
- Противоречивость сообщений – содержат спорные идеи (мысли, предложения, выводы).

Рассмотри подробнее критерий ранжирования по актуальности информации. Остальные критерии (номинации) ранжирования будут представлены в следующей заметке.

Ранг сообщения в номинации актуальность определяется как функция от сумм всех пользовательских:

1. просмотров (View) этого сообщения. Имеется, конечно, в виду, что пользователь сначала получает только общий список сообщений.
2. прямых ответов - комментариев верхнего уровня к этому сообщению
3. голосований Согласен - Не согласен, не зависимо от того, как конкретно проголосовал каждый пользователь
4. комментариев более нижних уровней, связанных с этим сообщением
5. голосований к этим комментариям, опять же независимо от того, какие они

Каждый аргумент (сумма) имеет свой весовой коэффициент, выбор которого может сыграть решающую роль в корректности номинации. Не углубляясь пока в тонкости этого вопроса можно, в общем, наметить следующие приоритеты (в порядке убывания значения весовых коэффициентов): 2, 1, 3, 4, 5. При этом для аргументов 4 и 5, связанных с комментариями нижнего уровня, весовой коэффициент должен резко понижаться для каждого следующего уровня.

Почему я всё-таки отдаю предпочтение комментариям по отношению к обычным просмотрам (прочтениям) сообщений. Ответ, мне кажется прост. Мы все мастера делать броские аннотации, как я по совету уважаемого sheller я и сделал к этой заметке. В тоже время тяжело не согласиться с утверждением dik , что за «заманчивой превьюшкой», часто «скрываться откровенная пустышка» (смотри комментарии к предыдущей заметке в habrahabr). Надеюсь, к моим заметкам это не относитсяsmile.gif. А вот комментарий каждый из нас, как правило, будет писать только в том случае, если материал его задел за живое.

Как мы видим, здесь прямые пользовательские оценки либо вообще не учитываются (например, «нравится - не нравится»), либо идут с меньшим весом («согласен- не согласен»), чем его косвенные действия, которые объективно отражают реальный интерес пользователя к данному сообщению. Ведь и в самом деле трудно предположить, что вы будете знакомиться с неинтересными и бесполезными для вас материалами, голосовать по ним и участвовать в их обсуждениях. Другими словами, практика (ваши действия, а не намерения и пристрастия) – критерий истины.

Только один пример для иллюстрации сказанного. Есть у меня один верный читатель – мой заклятый друг. Нет, не тот, о котором вы подумали - здесь всё в рамках допустимого, хотя иногда и тянет на Что- то не так. Кто он и и откуда, не имеет сейчас никакого значения. Главное, что не пропускает "мой друг" почти ни одной моей заметки. При этом чистит меня, как только может и минусы соответствующие расставляет. Почти риторический вопрос, актуальны ли для него мои мысли или нет? А может быть это просто такой себе современный информационный Робин Гуд, который посвятил всю свою жизнь защите сирых и бедных пользователей социального веба?

Нетрудно также заметить, что в определении критерия актуальности я следую известному правилу: «новое – это хорошо забытое старое». Ведь вспомним, какие постинги мы, прежде всего, читаем на форумах, построенных на традиционных движках типа IPB? Правильно, те, которые до нас больше всего просмотрели и прокомментировали другие. Правда, в известных мне форумных движках в выходных листингах редко производится упорядочение сообщений по критерию актуальности, но ведь и времена сейчас другиеsmile.gif. Это, кстати, ещё раз к прозвучавшему в мой адрес намёку об использовании «перелицованного форума».

А теперь нам будет проще перейти и к самому «больному вопросу социалки». К вопросу о том, кто, как и почему нас с вами ранжирует.

Ранжирование пользователей


Ранг пользователя в существующих ресурсах определяется как:

digg – не ранжирует

reddit - некоторая автоматически вычисляемая функция от некоторой автоматически определяемой интегральной оценки всех сообщений(основных и комментариев) пользователя. Такой ранг пользователя здесь называется Карма

news2 – некоторая простая функция от прямое голосования других («оценивающих») пользователей по данному («оцениваемому») пользователю. Такая интегральная оценка здесь называется Репутация. При этом для выражения своего отношения к коллеге вы можете использовать, если заслужили, конечно, такие варианты, как забанить!(запретить, или, говоря по простому, закопать, похоронить), нейтральное, хорошее.

habrahabr – некоторая простая функция от прямое голосования («за» и «против») других («оценивающих») пользователей по поданному («оцениваемому») пользователю. Такая интегральная оценка здесь называется Карма.

del.icio.us (bobrdobr.ru) – ранжирование не используется.

Как мы видим, везде, за исключением reddit, если ранжирование пользователей имеет место быть, то оно всегда прямое. Другими словами статус некоторого пользователя напрямую зависит от отношения к нему других пользователей. Даже в таком явно претендующем на интеллигентность и элитность ресурсе, как e-xecutive.ru, пользователи могут напрямую присвоить другим пользователям звания новичок, мастер, гуру и даже проставить коллеге чёрную метку. Отсюда и в этом элитном клубе обычные для «социалок-коммуналок» дрязги типа: «как же так, вчера был гуру, а сегодня после участия в одной дискуссии вдруг превратился в новичка?!». А что ещё можно ожидать?

Предлагается для ИСР:

1. Ранжирование по номинациям - многокритериальное ранжирование
2. Труд – превыше всего. В каждой номинации пользователи оцениваются только по результатам своего информационного труда на благо ресурса и всех его пользователей
3. Типы сообщений, генерируемых пользователем, учитывается в каждой номинации.
4. Актуальность сообщений пользователя - основная номинация. Именно по этому, и только по этому, критерию определяется статус пользователя в системе и все соответствующие этому статусу возможности
5. Поощрение первых пользователей, но только в кратковременной перспективе

Сначала поговорим о ранжировании пользователей в основной номинации - актуальности их информационной деятельности.

Ранг пользователя в номинации актуальность определяется как суммирующая функция от оценок всех его сообщений по критерию актуальности. При этом для каждого сообщения учитывается:

1 тип сообщения:
1) оригинальное сообщение
2) опросник (анкета, голосование)
3) ссылка без аннотации
4) ссылка с краткой аннотацией:
-- материал на языке ресурса
-- материал на иностранном языке (перевод)
5) реферат – ссылка с развёрнутой аннотацией:
-- материал на языке ресурса
-- материал на иностранном языке (перевод)
6) комментарий
7) ответ на вопросы анкеты
2 дата постинга - для сообщений льготного начального) периода
3 оценка сообщения по критерию актуальности. Для основных сообщений этот критерий был рассмотрен выше. Что касается комментариев, то их актуальность оценивается по аналогичной схеме.

Каждый аргумент имеет свой весовой коэффициент. Не углубляясь пока в тонкости этого вопроса, можно, в общем, разместить аргументы в порядке убывания их веса в следующем порядке: 1, 3, 2. Что касается критериев оценки типов сообщений, то общая схема выглядит примерно так: высший приоритет (наибольший относительный вес) – оригинальному сообщению, далее идут рефераты, после этого - ссылки с краткими комментариями и опросники, затем – ссылки без комментариев, и замыкают всё комментарии и ответы на вопросы анкеты. При этом из аннотируемых ссылок предпочтение, конечно, отдается ссылка на иноязычные материалы.

Как мы видим, при таком подходе никто и никогда не может прямо повлиять на статус других пользователей. Более того, пользователю даже косвенно (через оценку сообщений) будет очень не просто навязать своё мнение о некотором пользователе всем другим пользователям.. А всё это, с моей точки зрения является основой интеллигентности любого ресурса.

Победители в номинациях, где пользователи ранжируются по актуальности своих сообщений, могут называться, например, академиками, мастерами, гуру, экспертами, как вам больше нравится.

Кстати, и опять о «хорошо забытом старом». Ведь предложенный подход является ничем иным, как развитием концепции оценки пользователей, принятой в большинстве традиционных форумах (на том же движке IBP, например).

Хорошо, может спросить читателей, зачем было тогда «огород городить», подробно рассматривая в предыдущей заметке различные оценки, которыми пользователь прямо «награждает» сообщения, если мы их не учитываем при ранжировании авторов в номинации актуальность. Сразу отвечаю – для всех других номинаций. Подробнее об этом мы поговорим в следующей заметке. Здесь же только несколько примеров других номинаций/критериев ранжирования пользователей (наименования номинаций приведены лишь для иллюстрации):

-Выразитель чаяний - по общепризнанности своих идей (мыслей, предложений, выводов) общественностью ресурса
-Белая ворона - по неприемлемости своих идей (мыслей, предложений, выводов) для общественности ресурса
-Возмутитель спокойствия - по наибольшему количеству противоположных оценок и споров, которые вызвали его идеи (мысли, предложения, выводы).

Остаётся один вопрос. А можно ли попытаться всё-таки найти некоторый интегральный критерий ранжирования, где в одной гремучей смеси перемешать академиков, белых ворон, выразителей чаяний и возмутителей спокойствия? Долго думал над этим и пришёл к выводу - нет, нельзя. Хотя, может быть, и найдётся алхимик, который умудрится это сделать. Мне же кажется, что сосредоточиться надо на другом - дать каждому пользователю возможность адаптировать все номинации по своему вкусу и даже приближаться к своему персональному интегральному критерию. Но об этом позже...

Ранжирование сайтов


Такой интересный и, с моей точки зрения, очень полезный механизм, как оценка сайтов – источников, из рассматриваемых ресурсов я встретил только в news2. Однако, к сожалению, здесь пользователь также может прямо влиять на результирующую оценку.

Я же предлагаю использовать для решения этой задачи в ИСР подход, аналогичный предложенному в этой заметке для ранжирования пользователей.

------------
Главный вывод: чисто социалистический лозунг «От каждого по способности, каждому по труду», вынесенный в заголовок этой заметки может оказаться совсем не плохим применительно к социальному вебу. Да, и, если хорошо подумать, не такой он уж и плохой для реальной жизни. Беда только в том, что никто его и никогда не собирался в этой жизни по настоящему использовать. Но это уже совсем другая песня...

В следующей заметке мы подробнее рассмотрим требования к ИСР в части реализации критериев ранжирования информации (сообщений, сайтов) и пользователей, отличных от рассмотренных здесь критериев актуальности, место, роль и примеры использования различных номинаций в системе. Что касается детального описания весовых коэффициентов и соответствующих алгоритмов ранжирования, то, как вы понимаете, это может быть предметом рассмотрения только в более узкой партнёрской среде. Здесь же только скажу, что они разработаны, и многие из них уже промоделированы.

И несколько слов к итогам обсуждению моей предыдущей заметки данной серии (в habrahabr). К сожалению, итогов как раз то и нет - предметный разговор, несмотря на большое количество комментариев, пока не получается. Видно "принципы" всё-таки обсуждать легче, чем конкретные предложения. Да, и известно, что "дружить против" всегда проще, чем " дружить за". А именно то, насколько "пойдёт" задуманный мной разговор, определит тактику размещения заметок этой серии. Надеюсь, что ещё не вечер...
User is offlineProfile CardPM
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 User(s) are reading this topic (1 Guests and 0 Anonymous Users)
0 Members:

 



Lo-Fi Version Time is now: 18th January 2018 - 03:16 PM