Как рандомизировать значения от 1 до 10 для реалистичных оценок?

У меня есть база данных фильмов, в которую мне нужно заполнить данные, чтобы было легче тестировать и разрабатывать приложение. Есть таблицы для хранения рейтингов фильмов и учетных записей пользователей, пользователи оценивают фильмы.

Я начал разрабатывать сценарий для заполнения базы данных фальшивыми и общими данными, но я не знаю, как рандомизировать рейтинг. Для каждого фильма я выбираю случайное количество пользователей, 100, 500, 1000, что угодно. И для каждого из этих пользователей я рандомизирую рейтинг от 1 до 10. Но эти оценки дают одинаковое среднее значение, около 5. Это означает, что распределение оценок (от 1 до 10) для конкретного фильма в основном одинаковое. Это совсем не «реалистично», поскольку все фильмы с такими оценками будут иметь одинаковое среднее значение, поэтому одинаковые оценки от разных пользователей и разного количества пользователей на самом деле не имеют значения.

Я хотел, чтобы фильм А был в среднем 7, фильм B в среднем 5, фильм C в среднем 8 и т. д. Но я просто не хочу, чтобы среднее значение было разным для каждого фильма. Я имею в виду, было бы неплохо выставить такие рейтинги (для определенного количества пользователей): Но эти оценки дают одинаковое среднее значение, около 5. Это означает, что распределение оценок (от 1 до 10) для конкретного фильма в основном одинаковое. Это совсем не «реалистично», поскольку все фильмы с такими оценками будут иметь одинаковое среднее значение, поэтому одинаковые оценки от разных пользователей и разного количества пользователей на самом деле не имеют значения.

Я хотел, чтобы фильм А был в среднем 7, фильм B в среднем 5, фильм C в среднем 8 и т. д. Но я просто не хочу, чтобы среднее значение было разным для каждого фильма. Я имею в виду, было бы неплохо выставить такие рейтинги (для определенного количества пользователей): Но эти оценки дают одинаковое среднее значение, около 5. Это означает, что распределение оценок (от 1 до 10) для конкретного фильма в основном одинаковое. Это совсем не «реалистично», поскольку все фильмы с такими оценками будут иметь одинаковое среднее значение, поэтому одинаковые оценки от разных пользователей и разного количества пользователей на самом деле не имеют значения.

Я хотел, чтобы фильм А был в среднем 7, фильм B в среднем 5, фильм C в среднем 8 и т. д. Но я просто не хочу, чтобы среднее значение было разным для каждого фильма. Я имею в виду, было бы неплохо выставить такие рейтинги (для определенного количества пользователей): вообще, поскольку все фильмы с такими оценками будут иметь одинаковое среднее значение, то есть одинаковые оценки от разных пользователей и разного количества пользователей, на самом деле не имеет значения.

Я хотел, чтобы фильм А имел в среднем 7, фильм B в среднем 5, фильм C в среднем 8 и т. Д. Но я просто не хочу, чтобы среднее значение было разным для каждого фильма. Я имею в виду, было бы неплохо выставить такие рейтинги (для определенного количества пользователей): вообще, поскольку все фильмы с такими оценками будут иметь одинаковое среднее значение, то есть одинаковые оценки от разных пользователей и разного количества пользователей, на самом деле не имеет значения.

Я хотел, чтобы фильм А имел в среднем 7, фильм B в среднем 5, фильм C в среднем 8 и т. Д. Но я просто не хочу, чтобы среднее значение было разным для каждого фильма. Я имею в виду, было бы неплохо выставить такие рейтинги (для определенного количества пользователей): http://www.imdb.com/title/tt1046173/ratings или это http://www.imdb.com/title/tt0486640/ratings

Знаете, что-то случайное, что может создать два разных варианта, подобных приведенным выше. Я нажимаю кнопку «Обновить» и получаю первый график, я нажимаю «Обновить» и получаю второй, нажимаю еще раз и получаю что-то другое или подобное, что-то «случайное» и «реалистичное».

Я также собираюсь отображать такие графики на мое приложение, поэтому было бы неплохо иметь разные дистрибутивы. Но я понятия не имею, как я могу выполнить это случайным образом с помощью простого скрипта для генерации всего этого.

Как я могу решить эту проблему? Может быть, это слишком много работы, которая того не стоит?

Может быть, что-нибудь попроще, например, выберите точку (от 1 до 10), а затем создайте нормальное распределение оценок, при котором выбранная точка будет самой высокой, это сработает для меня.

5
задан Ricardo Amaral 30 December 2010 в 02:13
поделиться