Механизмы рекомендации для [закрытых] JAVA-приложений

Я знаю, что это немного старо в этой точке, но в моем поиске лучшего решения, я столкнулся с этим вопросом. Я в настоящее время использую функцию для упорядочивания. Это хорошо работает для моей цели отсортировать записи, которые называют со смешанной числовой альфой ('объект 1', 'объект 10', 'объект 2', и т.д.)

CREATE FUNCTION [dbo].[fnMixSort]
(
    @ColValue NVARCHAR(255)
)
RETURNS NVARCHAR(1000)
AS

BEGIN
    DECLARE @p1 NVARCHAR(255),
        @p2 NVARCHAR(255),
        @p3 NVARCHAR(255),
        @p4 NVARCHAR(255),
        @Index TINYINT

    IF @ColValue LIKE '[a-z]%'
        SELECT  @Index = PATINDEX('%[0-9]%', @ColValue),
            @p1 = LEFT(CASE WHEN @Index = 0 THEN @ColValue ELSE LEFT(@ColValue, @Index - 1) END + REPLICATE(' ', 255), 255),
            @ColValue = CASE WHEN @Index = 0 THEN '' ELSE SUBSTRING(@ColValue, @Index, 255) END
    ELSE
        SELECT  @p1 = REPLICATE(' ', 255)

    SELECT  @Index = PATINDEX('%[^0-9]%', @ColValue)

    IF @Index = 0
        SELECT  @p2 = RIGHT(REPLICATE(' ', 255) + @ColValue, 255),
            @ColValue = ''
    ELSE
        SELECT  @p2 = RIGHT(REPLICATE(' ', 255) + LEFT(@ColValue, @Index - 1), 255),
            @ColValue = SUBSTRING(@ColValue, @Index, 255)

    SELECT  @Index = PATINDEX('%[0-9,a-z]%', @ColValue)

    IF @Index = 0
        SELECT  @p3 = REPLICATE(' ', 255)
    ELSE
        SELECT  @p3 = LEFT(REPLICATE(' ', 255) + LEFT(@ColValue, @Index - 1), 255),
            @ColValue = SUBSTRING(@ColValue, @Index, 255)

    IF PATINDEX('%[^0-9]%', @ColValue) = 0
        SELECT  @p4 = RIGHT(REPLICATE(' ', 255) + @ColValue, 255)
    ELSE
        SELECT  @p4 = LEFT(@ColValue + REPLICATE(' ', 255), 255)

    RETURN  @p1 + @p2 + @p3 + @p4

END

Затем вызов

select item_name from my_table order by fnMixSort(item_name)

, Это легко утраивает время обработки для простого чтения данных, таким образом, это не может быть идеальное решение.

11
задан Sean Owen 20 March 2013 в 22:06
поделиться

3 ответа

Apache Mahout - единственный, который я нашел для этой области (я тоже недавно искал).

Хотя Weka также может быть вариантом.

2
ответ дан 3 December 2019 в 04:33
поделиться

Если вы ищете более сырой движок, а не что-то специально настроенное для амазона или нетфликса, то Minion предоставляет "меры по схожести документов".

1
ответ дан 3 December 2019 в 04:33
поделиться

Я разработчик Mahout / Taste, и надеюсь, что он сделает то, что вам нужно, но в интересах сбалансированного покрытия, позвольте мне также указать вам на:

15
ответ дан 3 December 2019 в 04:33
поделиться
Другие вопросы по тегам:

Похожие вопросы: